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"Proteins purifiee SR-p70" . 
L'invention conceme de nouvelles sequences d'acides nucleiques de la famille des 
genes suppresseurs de tumeurs apparentee avec le gene de la proteine p53, et les 
sequences proteiques correspondantes. 

L'invention conceme egalement les applications prophylactiques. therapeutiques et 
diagnostiques de celles-ci. notamment dans le domaine des pathologies liees aux 
phenomenes d'apoptose ou de transformation cellulaire. 

Les genes suppresseurs de tumeurs jouent un role clef dans la protection contre les 
phenomenes de cancerisation, et toute modification susceptible d'entrainer la perte 
de I'un de ces genes, son inactivation ou son dysfonctionnement. peut avoir un 
caractere oncogene, creant ainsi des conditions favorables au developpement d'un 
cancer. 

Les auteurs de la presente invention ont identifie les produits de transcription d'un 
nouveau gene ainsi que les proteines correspondantes. Ce gene SR-p70 est 
apparente au gene suppresses de tumeur p53. dont I'activite anti-tumorale est liee a 
son activite de facteur de transcription et plus specifiquement aux contrdles exerces 
sur I'activite des genes Bax et Bcl-2, instrumentaux dans les mecanismes de mort 
cellulaire. 

La presente invention est done relative a des proteines purifiees SR-p70, ou des 
fragments biologiquement actifs de celles-ci. 

L'invention conceme egalement des sequences d'acides nucleiques isolees codant 
pour lesdites proteines ou leurs fragments biologiquement actifs et des 
oligonucleotides specifiques obtenues a partir de ces sequences. 
Elle vise en outre les vecteurs de clonage et/ou d'expression contenant au moins 
I'une des sequences nudeotidiques definies ci-dessus. et les cellules hdtes transfec- 
tees par ces vecteurs de clonage et/ou d'expression dans des conditions permettant 
la replication etfou i'expression de I'une desdites sequences nudeotidiques. 
Les methodes de production de proteines recombinantes SR-p70 ou de leurs frag- 
ments biologiquement actifs par les cellules holes transferees font egalement partie 
de l'invention. 

L'invention comprend egalement des anticorps ou des derives d'anticorps specifiques 
des proteines definies ci-dessus. 

Elle vise en outre des methodes de detection des cancers, soit par la mesure de 
('accumulation des proteines SR-p70 dans les tumeurs selon des techniques 
d'immuno-histochimie. soit par la mise en evidence dans le serum de patients 
d'auto-anticorps diriges contre ces proteines. 
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L'invention conceme egalement tout inhibiteur ou activateur de I'activite du SR-p70 
par exemple d'interaction proteine-proteine faisant intervenir le SR-p70. 
EHe concerne aussi des sequences oiigonucleotidiques antisens, specifiques des 
sequences d'acides nucleiques ci-dessus, pouvant moduler in vivo I'expression du 
gene SR-p70. 

L'invention comprend enfin une methode de th6rapie genique dans laquelle des 
vecteurs tets que par exemple des vecteurs viraux inactives capabtes de transferer 
des sequences codantes pour une proteine selon l'invention sont injectes a des 
cellules deficientes pour cette proline, a des fins de regulation des phenomenes 
d'apoptose ou de reversion de la transformation. 

La presente invention a pour objet un polypeptide purifie comprenant une sequence 
d'acides amines choisie parmi : 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ 10 n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) la sequence SEQ ID n° 8 ; 

e) la sequence SEQ ID n° 10 ; 

f) la sequence SEQ ID n° 13 ; 

g) la sequence SEQ ID n 9 15 ; 

h) la sequence SEQ ID n° 17 ; 

i) la sequence SEQ ID n° 19 ; 

j) toute sequence biologiquement active derivee de SEQ ID n° 2, SEQ ID n° 4, 
SEQ ID n 9 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n° 13, SEQ ID n° 15, SEQ ID n° 17 
ou SEQ IDn° 19. 

Dans la description de l'invention, on utilise les definitions suivantes : 

- proteine SR-p70 : un polypeptide comprenant une sequence d'acides amines 
choisie pamni les sequences SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, SEQ ID n° 8. 
SEQ ID n° 10, SEQ ID n°13, SEQ ID n* 15, SEQ ID n tf 17 ou SEQ ID n° 19, ou tout 
fragment ou derive de celui-ci biologiquement actif. 

- derive : tout polypeptide variant du polypeptide de sequence SEQ ID n°2, SEQ 
ID n<> 4, SEQ ID n° 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n° 13, SEQ ID n° 15, SEQ 
ID n° 17 ou SEQ ID n 8 19 ou toute molecule rdsultant d*une modification de nature 
genetique et/ou chimique de la sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, 
SEQ ID n° 8, SEQ ID n° 10, SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 ou SEQ ID n° 
19 c'est-d-dire obtenue par mutation, deletion, addition, substitution et/ou modification 
chimique d'un seul ou d'un nombre limite d'acides amines, ainsi que toute sequence 
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isoforme, c'est-a-dire una sequence identique a la sequence SEQ ID n° 2, SEQ ID 
n° 4, SEQ ID n° 6, SEQ ID n° 8, SEQ ID n* 10. SEQ ID n" 13, SEQ ID n' 15, SEQ ID 
n a 17 ou SEQ ID n'19 a Tun de ses fragments ou sequences modifiees. contenant 
un ou plusieurs acides amines sous la forme d'enantiomere D. lesdites sequences 
variantes. modifiees ou isoformes ayant conserve au moins I'une des proprietes les 
rendant biologiquement actives. 

- biologiquement actif : capable de se lier a I'ADN et/ou d'exercer une activite de 
facteur de transcription et/ou de participer au controle du cycle cellulaire, de la 
differentiation et de I'apoptose et/ou capable d'etre reconnu par les anticorps 
specifiques du polypeptide de sequence SEQ ID n°2. SEQ ID n°4, SEQ ID n° 6, SEQ 
ID n« 8, SEQ ID n° 10, SEQ ID n'13. SEQ ID n' 15, SEQ ID n" 17 ou SEQ ID n° 19 
et/ou capable d induire des anticorps qui reconnaissent ce polypeptide. 
La fabrication de derives peut avoir differents objectifs, dont en particulier celui 
daugmenter I'affinite du polypeptide pour I'ADN ou son activite de facteur de 
transcription, celui d'ameliorer ses taux de production, d'augmenter sa resistance a 
des proteases, de modifier ses activites biologiques ou de lui conferer de nouvelles 
proprietes pharmaceutiques et/ou biologiques. 

Parmi les polypeptides de I'invention, on prefere le polypeptide d'origine humaine, 
comprenant la sequence SEQ ID n° 6, SEQ ID n° 13. SEQ ID n°15, SEQ ID n"17 ou 
SEQ ID n°l9. Le polypeptide de 636 acides amines correspondent a la sequence 
SEQ ID n a 6 est identique a plus de 97 % au polypeptide de sequence SEQ ID n° 2. 
Le polypeptide de sequence SEQ ID n° 2 et celui de sequence SEQ ID n» 4 sont deux 
produits d'expression d'un meme gene, de meme pour les sequences SEQ ID n" 8 et 
SEQ ID n° 10 et pour les sequences SEQ ID n° 6, SEQ ID n e 13. SEQ ID n 9 15. SEQ 
IDn' 17etSEQIDn° 19. 

Comma il sera explique dans les exemples. le polypeptide de sequence SEQ ID n° 4 
correspond a une terminaison prematuree du peptide de sequence SEQ ID n° 2. liee 
a un epissage altematif du transcript codant pour le polypeptide de SEQ ID n° 2 le 
plus long (ARN messager) du gene correspondant De meme chez I humain. les 
polypeptides correspondant aux sequences SEQ ID n° 6. SEQ ID n 9 13. SEQ ID n'15. 
SEQ ID n' 17 et SEQ ID n' 19 divergent dans leur composition au niveau des parties. 
N- et/ou -C terminates et ce consecutif a des epissages altematifs d'un meme 
transcript primaire. La sequence peptidique N-terminale de la sequence SEQ ID n" 
10 est deletes, ce lie a un epissage altematif de son transcript codant. 
Avantageusement. I'invention vise un polypeptide correspondant au domaine de 
fixation sur I'ADN de I'un des polypeptides precedents. 
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Ce domaine correspond a la sequence comprise entre le residu 110 et ie residu 310 
pour les sequences SEQ ID n° 2 ou 6, et entre Je residu 60 et le residu 260 pour la 
sequence SEQ ID n° 8. 

La presente invention a egalement pour objet des sequences d'acides nucleiques 
codant pour une proteine SR-p70 ou des fragments ou derives de celle-ci 
biologiquement actifs. 

Plus pref6rentiellement, I'invention a pour objet une sequence d'acides nucleiques 
isolee choisie parmi : 

a) la sequence SEQ ID n° 1 ; 

b) la sequence SEQ ID n° 3 ; 

c) la sequence SEQ ID n° 5 ; 

d) la sequence SEQ ID n°7 ; 

e) la sequence SEQ ID n°9 ; 
0 *a sequence SEQ ID n° 11 ; 

g) la sequence SEQ ID n° 1 2 ; 

h) la s6quence SEQ ID n° 14 ; 

i) la sequence SEQ ID n° 16 ; 
j) la sequence SEQ ID n° 18 ; 

k) les sequences d'acides nucleiques capables de s hybrider specifiquement a 
la sequence SEQ ID n° 1, SEQ ID n° 3. SEQ ID n° 5, SEQ ID n°7, SEQ ID n°9, 
SEQ ID n° 11, SEQ ID n° 12. SEQ ID n°14 ou SEQ ID n° 16 ou SEQ ID n° 18 ou a 
leurs sequences complSmentaires, ou de s'hybrider specifiquement a leurs 
sequences proximales ; 

I) les sequences d6rivees des sequences a) r b), c), d), e) t f), g), h), i), j) ou k) du 
fait de la deg6n§rescence du code genetique. 

Selon un mode de realisation prefere, I'invention a pour objet les sequences 
nudeotidiques SEQ ID n° 5, SEQ ID n Q 12, SEQ ID n° 14, SEQ ID n° 16 et SEQ ID n° 
18 correspondant respectivement aux ADNc des prolines humaines des sequences 
SEQ ID n° 6, SEQ ID n° 13, SEQ ID n° 15, SEQ ID n° 17 et SEQ ID n° 19. 
Les diffdrentes sequences nucteotidiques de I'invention peuvent etre dorigine 
artificielle ou non. II peut s'agir de sdquences d'ADN ou d'ARN, obtenues par criblage 
de banques de sequences au moyen de sondes elabordes sur la base des 
sequences SEQ ID n° 1. 3. 5. 7, 9, 11, 12. 14, 16 ou 18. De telles banques peuvent 
etre preparees par des techniques classiques de biologie moleculaire t connues de 
I'homme de Tart. 
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Les sequences nucteotidiques selon I'invention peuvent egalement etre preparees par 
synthese chimique, ou encore par des methodes mixtes incluant ta modification 
chimique ou enzymatique de sequences obtenues par criblage de banques. 
Ces sequences nucleotidiques permettent la realisation de sondes nucteotidiques, 
capables de s'hybrider fortement et specifiquement avec une sequence d'acides nu- 
cleiques, d'un ADN genomique ou d'un ARN messager, codant pour un polypeptide 
selon I'invention ou un fragment biologiquement actif de celui-cL De telles sondes font 
egalement partie de I'invention. Eiles peuvent etre utilisees comme outil de diagnostic 
in vitro pour la detection, par des experiences d'hybridation, de transcripts specifiques 
des polypeptides de invention dans des echantillons biologiques ou pour la mise en 
evidence de syntheses aberrantes ou d'anomalies genetiques telles que la perte 
d'h6t6rozygotie ou le rearrangement genetique, resultant d'un polymorphisme, de 
mutations ou d'un epissage different. 

Les sondes de ('invention comportent au minimum 10 nucleotides, et au maximum 
comportent la totalite de la sequence du gene SR-p70 ou de son ADNc contenu par 
exemple dans un cosmide. 

Parmr les sondes les plus courtes, c'est-a-dire d'environ 10 a 20 nucleotides, les 
conditions d'hybridation appropriees correspondent aux conditions stringentes 
usuellement utilisees par I'homme de metier. 

La temperature utilisee est de preference comprise entre T m -5' C a T m -30° C, de 
preference encore entre T m -5' C et T m -10° C, T m etant la temperature de fusion, 
temperature d laquelle 50 % des brins d'ADN apparies se separent 
L'hybridation est de preference menee dans des solutions a force ionique elevee. 
telles que notamment des solutions 6 x SSC. 

De manure avantageuse, les conditions d'hybridation utilisees sont les suivantes : 

- temperature : 42° C, 

- tampon d'hybridation : 6 x SSC f 5 x Denhart* s, 0,1 % SDS f 
telles que ddcrites dans i'exemple HI. 

Avantageusement, ces sondes sont representees par les oligonucleotides suivants ou 
leurs comptementaires : 

SEQ ID n° 20 : GCG AGC TGC CCT CGG AG 

SEQ ID n* 21 : GGT TCT GCA GGT GAC TCA G 

SEQ ID n* 22 : GCC ATG CCT GTC TAC AAG 

SEQ ID n° 23 : ACC AGC TGG TTG ACG GAG 

SEQ ID n° 24 : GTC AAC CAG CTG GTG GGC CAG 

SEQ ID n° 25 : GTG GAT CTC GGC CTC C 
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SEQ ID n° 26 : AGG CCG GCG TGG GGA AG 
SEQ ID n d 27 : CTT GGC GAT CTG GCA GTA G 
SEQ ID n° 28 : GCG GCC ACG ACC GTG AC 
SEQ ID n° 29 : GGC AGC TTG GGT CTC TGG 
SEQ ID n° 30 ; CTG TAC GTC GGT GAC CCC 
SEQ ID n° 31 : TCA GTG GAT CTC GGC CTC 
SEQ ID n° 32 : AGG GGA CGC AGC GAA ACC 
SEQ ID n° 33 ; CCA TCA GCT CCA GGC TCT C 
SEQ ID n° 34 : CCA GGA CAG GCG CAG ATG 
SEQ ID n° 35 : GAT GAG GTG GCT GGC TGG A 
SEQ ID n° 36 : TGG TCA GGT TCT GCA GGT G 
SEQ ID n° 37 : CAC CTA CTC CAG GGA TGC 
SEQ ID n° 38 : AGG AAA ATA GAA GCG TCA GTC 
SEQ ID n° 39 : CAG GCC CAC TTG CCT GCC 
SEQ ID n° 40 : CTG TCC CCA AGC TGA TGA G 

Pref6rentiellement, les sondes de I'invention sont marquees, prealablement a leur 

utilisation. Pour cela, plusieurs techniques sont a la portee de rhomme du metier 

(marquage fluorescent radioactif, chimioluminescent, enzymatique, etc). 

Les methodes de diagnostic in vitro dans lesquelles ces sondes nucleotidiques sont 

mises en oeuvre, sont incluses dans I'objet de la presente invention. 

Ces methodes concement par exemple ia detection de syntheses anormales (ex. 

accumulation de produits de transcription) ou d'anomalies genetiques, telles que la 

perte d'heterozygotie et le rearrangement genStique, et les mutations ponctuelles au 

niveau des sequences nucteotidiques d'acides nucldiques codant pour una proteine 

SR-p70, selon la ddfinition donnee pr6c6demment 

Les sequences nucldotidiques de invention sont egalement utiles pour la fabrication 
et Tutilisation d'amorces oligonucldotidiques pour des reactions de sequen$age ou 
^amplification specifique selon la technique dite de PGR ou toute variante de celle-ci 
(Ligase Chain Reaction (LCR), ...). 

Des paires d'amorces pr6ferees sont constituees par des amorces choisies sur les 
sequences nuddotidiques : SEQ ID n° 1 : sequence de singe de 2 874 nucleotides et 
SEQ ID n°5 : ADNc SR-p70a humain, notamment en amont du codon ATG d'initiation 
et en aval du codon TGA d'arret de traduction. 

Avantageusement ces amorces sont representees paries couples suivants: 
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- couple n°1 : 

amorce sens : GCG AGC TGC CCT CGG AG (SEQ ID n° 20) 
amorce antisens : GGT TCT GCA GGT GAG TCA G (SEQ ID n° 21) 

- couple n°2 : 

amorce sens : GCC ATG CCT GTC TAC AAG (SEQ ID n°22) 
amorce antisens : ACC AGC TGG TTG ACG GAG (SEQ ID n° 23) 

- couple n° 3 : 

amorce sens : GTC AAC CAG CTG GTG GGC CAG (SEQ ID n° 24) 
amorce antisens : GTG GAT CTC GGC CTC C (SEQ ID n° 25) 

- couple n° 4 : 

amorce sens ; AGG CCG GCG TGG GGA AG (SEQ ID n° 26) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

- couple n° 5 : 

amorce sens : GCG GCC ACG ACC GTG A (SEQ ID n° 28) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n°29) 

- couple n Q 6 : 

amorce sens : CTG TAC GTC GGT GAC CCC (SEQ ID n°30) 
amorce antisens : TCA GTG GAT CTC GGC CTC (SEQ ID n° 31) 

- couple n° 7 : 

amorce sens ; AGG GGA CGC AGC GAA ACC (SEQ ID n° 32) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n° 29) 

- couple n° 8 : 

amorce sens : CCCCCCCCCCCCCCN (ou N est egal iG.AouT) 
amorce antisens : CCA TCA GCT CCA GGC TCT C (SEQ ID n w 33) 

- couple n° 9 : 

amorce sens : CCCCCCCCCCCCCCN (ou N est egal £ G, A ou T) 
amorce antisens : CCA GGA CAG GCG CAG ATG (SEQ ID n° 34) 
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- couple n° 10 : 

amorce sens : CCCCCCCCCCCCCCCN (ou N est egaj a G, A ou T) 
amorce antisens ; CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

- couple n° 1 1 : 

amorce sens : CAC CTA CTC CAG GGA TGC (SEQ ID n° 37) 
amorce antisens : AGG AAA ATA GAA GCG TCA GTC (SEQ ID n* 38) 

- couple n 8 12 : 

amorce sens : CAG GCC CAC TTG CCT GCC (SEQ ID n° 39) 
amorce antisens : CTG TCC CCA AGC TGA TGA G (SEQ ID n° 40) 

Ces amorces correspondent aux sequences allant respectivement : 

- du nucleotide n° 124 au nucleotide n° 140 sur SEQ ID n* 1 et du nucleotide n° 
1 au nucleotide n° 17 sur SEQ ID n°5 pour SEQ ID N° 20 

- du nucleotide n° 2280 au nucleotide n° 2262 sur SEQ ID n° 1 et du nucleotide 
n° 2156 au nucleotide 2138 sur SEQ ID n°5 pour SEQ ID N° 21 

- du nucleotide n° 684 au nucleotide n° 701 sur SEQ ID n° 1 pour SEQ ID N° 22 

- du nucleotide n° 1447 au nucleotide n° 1430 sur SEQ ID n° 1 et du nucleotide 
1324 au nucleotide 1307 sur SEQ ID n°5 pour SEQ ID N° 23 

- du nucleotide 1434 au nucleotide 1454 sur SEQ ID n°1 et du nucleotide 1311 
au nucleotide! 331 sur SEQ ID n°5 pour SEQ ID n° 24 

- du nucleotide 2066 au nucleotide 2051 sur SEQ ID n°1 et du nucleotide 1940 
au nucleotide 1925 sur SEQ ID n°5 pour SEQ ID n°25. 

- du nucleotide 16 au nucleotide 32 sur SEQ ID n° 5 pour SEQ ID n° 26 

- du nucleotide 503 au nucleotide 485 sur SEQ ID n° 5 pour SEQ ID n° 27 

- du nucleotide 160 au nucleotide 176 sur SEQ ID n° 1 1 pour SEQ ID n° 28 

- du nucleotide 1993 au nucleotide 1976 sur SEQ ID n° 5 pour SEQ ID n° 29 

- du nucleotide 263 au nucleotide 280 sur SEQ ID n° 1 1 pour SEQ ID n 9 30 

- du nucleotide 1943 au nucleotide 1926 sur SEQ ID n° 5 pour SEQ ID n° 31 

- du nucleotide 128 au nucleotide 145 sur la sequence nucl6otidique representee 
a la figure 22 pour SEQ ID n° 32 

- du nucleotide 1 167 au nucleotide 1 149 sur SEQ ID n° 5 pour SEQ ID n° 33 

- du nucleotide 928 au nucleotide 91 1 sur SEQ ID n* 5 pour SEQ ID n° 34 

- du nucleotide 677 au nucleotide 659 sur SEQ ID n 9 5 pour SEQ ID n° 35 

- du nucleotide 1605 au nucleotide 1587 sur SEQ ID n° 5 pour SEQ ID n° 36 
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- du nucleotide 1 au nucleotide 18 sur la sequence nucleotidique representee a la 
figure 13 pour SEQ ID n° 37 

- du nucleotide 833 au nucleotide 813 sur la sequence nucleotidique representee 
a la figure 13 pour SEQ ID n° 38 

- du nucleotide 25 au nucleotide 42 sur la sequence nucleotidique representee a 
la figure 13 pour SEQ ID n° 39 

- du nucleotide 506 au nucleotide 488 sur la sequence nucleotidique representee 
a la figure 13 pour SEQ ID n° 40 



Les sequences nucleotidiques selon ('invention peuvent avoir par ailleurs des 
utilisations en therapie genique, notamment pour le controle des phenomenes d'apop- 
tose et de reversion de la transformation. 

Les sequences nucleotidiques selon invention peuvent par ailleurs etre utilisees pour 
la production de proteines recombinantes SR-p70, selon la definition qui a ete donnee 
a ce terms. 

Ces proteines peuvent §tre produites a partir des sequences nucleotidiques definies 
ci-dessus. selon des techniques de production de produits recombinants connues de 
I'homme du metier. Dans ce cas, la sequence nucleotidique utilisee est placee sous le 
controle de signaux permettant son expression dans un hote cellulaire. 
Un systeme efficace de production d'une proteine recombinante necessite de 
disposer d'un vecteur, par exemple d'origine plasmidique ou virale, et dune cellule 
hote compatible. 

L'hdte cellulaire peut etre choisi parmi des systemes procaryotes, comme les bacte- 
ries. ou eucaryotes, comme par exemple les levures, cellules d'insectes, CHO 
(cellules d § ovaires de hamster chinois) ou tout autre systeme avantageusement 
disponible. Un h6te cellulaire prefere pour I'expression des proteines de Invention est 
constitue par la bacteria E. coft notamment fa souche MC 1061 (Clontec). 
Le vecteur doit comporter un promoteur, des signaux d'initiation et de terminaison de 
la traduction, ainsi que les regions approprttes de regulation de la transcription. II doit 
pouvoir etre maintenu de fa?on stable dans la cellule et peut eventuellement 
posseder des signaux particuliers sp6cifiant la secretion de la proteine traduite. 
Ces differents signaux de contrdle sont choisis en fonction de Thote cellulaire utilise. A 
cet effet les sequences nuc!6otidiques selon I'invention peuvent etre inserees dans 
des vecteurs a replication autonome au sein de rhdte choisi, ou des vecteurs 
integratifs de I'h6te choisi. De tels vecteurs seront prepares selon les methodes 
couramment utilisees par Thomme du metier, et les clones en resultant peuvent etre 
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introduits dans un hote approprie par des methodes standard, telles que par exemple / 
Telectroporation. 

Les vecteurs de clonage et/ou d'expression contenant au moins Tune des sequences 
nucleotidiques definies ci-dessus font egalement partie de fa presente invention. 
Un vecteur de clonage et d'expression prefere est le piasmide pSE1 qui comporte a la 
fois les elements necessaires pour son utilisation comme vecteur de clonage dans 
E.coli (origine de replication dans £. colt et gene de resistance a Tampicilline, 
provenant du piasmide pTZ 18R), et comma vecteur d'expression dans les cellules 
animates (promoteur, intron, site de polyadenylation r origine de replication du virus 
SV40), ainsi que les elements permettant sa copie en simple brin dans un but de \ 
sequen?age (origine de replication du phage f1). 

Les caracteristiques de ce piasmide sont decrites dans la demande EP 0 506 574. 1 
Sa construction, ainsi que ('integration des ADNc provenant des sequences d'acides 
nucleiques de I'invention sont par ailleurs decrites dans les exemples ci-apres. 
Selon un mode de realisation prefere, les proteines de I'invention sont sous forme de 
proteines de fusion, notamment sous forme de proteine fusionnee avec la glutathione 
S-transferase (GST). Un vecteur d'expression d£signd dans ce cas est represents par 
le vecteur plasmidique pGEX-4T-3 (Pharmacia ref-27.4583). ' 
Uinvention vise en outre les cellules hdtes transferees par ces vecteurs precedents. 
Ces cellules peuvent etre obtenues par Introduction dans des cellules hdtes d'une 
sequence nucleotidique inseree dans un vecteur tel que d6fini ci-dessus. puis la mise 
en culture desdites cellules dans des conditions permettant la replication et/ou 
I'expression de la sequence nucleotidique transfectee. 

Ces cellules sont utilisables dans une methode de production d'un polypeptide 
recombinant de sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, SEQ ID n°8. 
SEQ ID n°10, SEQ ID n° 12, SEQ ID n* 14, SEQ ID n° 16 ou SEQ ID n° 18 ou tout 
fragment ou ddrive biologiquement actif de celui-cL / 
La mdthode de production d'un polypeptide de invention sous forme recombinante , 
est elle-m£me comprise dans la prdsente invention, et se caract6rise en ce que Ton 
cultive les cellules transfect6es dans des conditions permettant I'expression d'un 
polypeptide recombinant de sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, SEQ 
ID n°8. SEQ ID n°10, SEQ ID n° 12, SEQ ID n° 14, SEQ ID n° 18 ou SEQ ID n° 18 ou 
de tout fragment ou derive biologiquement actif de celui-ci, et que I'on recupere ledit 
polypeptide recombinant. 

Les proced6s de purification utilises sont connus de Thomme du metier. Le ' 
polypeptide recombinant peut §tre purifie a partir de lysats et extraits cellulaires, du 
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sumageant du milieu de culture, par des methodes utilisees individuellement ou en 
combinaison, telles que le fractionnement, les methodes de chromatographie. les 
techniques d'immunoaffinite a I'aide d'anticorps mono ou polyclonaux specifiques, etc. 
Une variante preferee consiste a produire un polypeptide recombinant fusionne a une 
proteine "porteuse" (proteine chimere). L'avantage de ce systeme est qu'il permet une 
stabilisation et une diminution de la proteolyse du produit recombinant une 
augmentation de la solubilite au cours de la renaturation in vitro et/ou une simplifi- 
cation de la purification lorsque le partenaire de fusion possede une affinite pour un 
ligand specifique. 

Avantageusement, les polypeptides de Invention sont fusionnes avec la glutathion 
S-transferase en position N-terminale (systeme "GST 1 Pharmacia). Le produit de 
fusion est dans ce cas detecte et quantifie grace a I'activite enzymatique de la GST. 
Le reactif colorimetrique utilise est un accepteur de gluthation, substrat de la GST. Le 
produit recombinant est purifie sur un support de chromatographie auquel ont ete 
prealablement couplees des moldcules de glutathion. 

Les anticorps mono ou polyclonaux capables de reconnaitre specifiquement une 
proteine SR-p70 selon la d6finition donnee precedemment font egalement partie de 
Tinvention. Des anticorps polyclonaux peuvent 6tre obtenus a partir du serum d'un 
animal immunise contre la proteine, produite par exemple par recombinaison 
genetique suivant la methode d6crite ci-dessus, selon les modes operatoires usuels. 
Les anticorps monocionaux peuvent §tre obtenus selon la methode classique de 
culture tfhybridomes decrite par Kdhler et Milstein, Nature, 1975. 256, 495-497. 
Des anticorps avantageux sont des anticorps diriges contre la region centrale 
comprise entre le residu 1 10 et le residu 310 pour les sequences SEQ ID n° 2 ou 6 ou 
entre le residu 60 et le residu 260 pour la sequence SEQ ID n° 8. 

Les anticorps selon Tinvention sont par exemple des anticorps chimeriques, des 

anticorps humanisms, des fragments Fab et F(ab')2. lis peuvent egalement se 

presenter sous forme d'immunoconjugues ou d'anticorps marques. 

Par ailleurs, outre leur utilisation pour la purification des polypeptides recombinants, 

les anticorps de Tinvention, en particulier les anticorps monocionaux, peuvent 

egalement Stre utilises pour la d6tection de ces polypeptides dans un echantiilon 

biologique. 

Hs constituent ainsi un moyen d'analyse immunocytochimique ou 
immunohistochimique de I'expression de proteines SR-p70 sur des coupes de tissus 
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specifiques, par exemple par immunofluorescence, marquage a I'or, 
immunoconjugues enzymatiques. 

lis permettent notamment de mettre en evidence une accumulation anonmale de 
proteines SR-p70 dans certains tissus ou prelevements biologiques. ce qui les rend 
utiles pour la detection des cancers ou le suivi de Involution ou de la remission de 
cancers preexistants. 

Plus generalement, les anticorps de Tinvention peuvent 6tre avantageusement mis en 
oeuvre dans toute situation ou ('expression d'une proteine SR-p70 doit etre observee. 
L'invention conceme done egalement un procede de diagnostic in vitro de pathologies 
correldes £ une expression ou une accumulation anormale de proteines SR-p70, 
notamment les phenomenes de cancelation, a partir d'un prelevement biologique, 
caracterise en ce que Ton met en contact au moins un anticorps de l'invention avec 
ledit prelevement biologique, dans des conditions permettant la formation eventuelle 
de complexes immunologiques specifiques entre une proteine SR-p70 et le ou lesdits 
anticorps et en ce que Ton detects les complexes immunologiques specifiques even- 
tueilement formes. 

L'invention conceme egalement un kit pour le diagnostic in vitro d'une expression ou 
une accumulation anormale de proteines SR-p70 dans un prelevement biologique 
et/ou pour la mesure du taux depression de celle-ci dans ledit prelevement compre- 
nant : 

- au moins un anticorps specifique d'une proteine SR-p70, eventuellement fixe 
sur un support, 

- des moyens de revelation de la formation de complexes antigenes/anticorps 
specifiques entre une proteine SR-p70 et ledit anticorps et/ou des moyens de 
quantification de ces complexes. 

L'invention vise egalement une methode de diagnostic pr6coce de la formation des 
tumeurs, par la mise en evidence dans le serum d'un individu, d'auto-anticorps diriges 
centre une proteine SR-p70. 

Une telle methode de diagnostic precoce est caracterisee en ce que Ton met en 
contact un echantillon de serum preleve chez un individu avec un polypeptide de 
('invention, eventuellement fixe sur un support, dans des conditions permettant la 
formation de complexes immunologiques specifiques entre ledit polypeptide et les 
auto-anttcorps eventuellement presents dans I'dchantillon de serum, et en ce que Ton 
detecte les complexes immunologiques specifiques eventuellement formes. 
L'invention a egalement pour objet une methode de determination d'une variability 
altelique, d'une mutation, d'une deletion, d'une insertion, d'une perte d'heterozygotie 
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ou d'une anomalie genetique du gene SR-p70, pouvant etre impliqu6es dans des 
pathologies caracterisee en ce qu'elle utilise au moins une sequence nucleotidique 
decrite ci-dessus. Parmi les methodes de determination d'une variability allelique, 
d'une mutation, d'une deletion, d'une insertion, d'une perte d'heterozygotie ou d'une 
anomalie gendtique du gene SR-p70, on prefere la methode caracterisee en ce 
qu'elle comprend au moins une etape d'amplification par PCR de la sequence 
nucleique able du SR-p70 susceptible de presenter un polymorphisme, une mutation, 
une deidtion ou une insertion d Taide de couple d'amorces de sequences 
nucleotidiques definies ci-dessus, une etape au cours de laquelie on precede au 
traitement des produits amplifies £ I'aide d'enzyme de restriction approprie et une 
etape au cours de laquelie on procdde a la detection ou au dosage d'au moins I'un 
des produits de la reaction enzymatique. 

(.'invention comprend egalement des compositions pharmaceutiques comprenant 
comme principe actif un polypeptide repondant aux definitions precedentes. prefe- 
rentiellement sous forme soluble, associe a un vehicule pharmaceutiquement 
acceptable. 

De telles compositions offrent une nouvelle approche pour traiter les phenomenes de 
cancerisation au niveau du controle de la multiplication et la differenciation cellulaire. 
Pr^ferentiellement, ces compositions peuvent etre administrees par voie systemique, 
de preference par voie intraveineuse, par voie intramusculaire, intradermique ou par 
voie orale. 

Leurs modes d'administration, posologies et formes galeniques optimaux peuvent etre 
determines seion les critdres generalement pris en compte dans I'etablissement d'un 
traitement thGrapeutique adapte a un patient comme par exemple I'age ou le poids 
corporel du patient, la gravitd de son etat general, la tolerance au traitement et les 
effets secondaires constates, etc. 

^invention comprend enfm une methode de th6rapie genique dans laquelie des 
sequences nucldotidiques codant pour une proline SR-p70 sont transferees a des 
cellules bibles par le biais de vecteurs viraux inactives. 

D'autres caracteristiques et avantages de ('invention apparaissent dans la suite de la 
description avec les exemples et les figures dont les legendes sont representees ci- 
aprds. 
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LEGENDE DES FIGURES 

Figure 1 : Comparaison nucleique de I'ADNc du SR-p70a de singe (correspondant 
a SEQ ID n°1) avec la sequence nucleique de I'ADNc de p53 de singe. 

Figure 2 : Comparaison proteique de SR-p70a de singe avec la proteine p53 de 
singe (sw : p53-cerae). 



10 



Figure 3 : Comparaison de la sequence nucleique de I'ADNc de SR-p70a et b de 
singe (correspondant respectivement d SEQ ID n° 1 et SEQ ID n° 3). 
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Figure 4 : Sequence nucleique et sequence proteique deduite de SR-p70a de 
singe. 

Figure 5 : Sequence nucleique partielle et sequence proteique deduite complete 
de 

SR-p70b de singe. 
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Figure 6 : Sequence nucleique partielle et sequence proteique complete deduite 
de 

SR-p70a humain (correspondant a SEQ ID n° 5). 
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Figure 7 : Sequence nucleique partielle et sequence proteique deduite complete 
de 

SR-p70c de souris (correspondant a SEQ ID n° 7). 
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Figure 6 : Sequence nucleique partielle et sequence proteique deduite partielle de 
SR-p70a de souris (correspondant a SEQ ID n 8 9). 

Figure 9 : Multialignement des proteines deduites des ADNc SR-p70 de singe 
(a et b), humain (a) et de souris (a et c). 
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Figure 10a : Immunoempreinte de la proteine SR-p70. 
Figure 10b : Detection de la proteine endogene SR-p70. 
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Figure 1 1 : Localisation chromosomique du gene SR-p70 humain. Le signal apparait 
sur le chromosome 1 , dans la region p36. 

Figure 12 : Structure genomique du gene SR-p70 et comparison avec celle du 
gene p53. Les sequences proteiques humaines du SR-p70a (ligne du 
haut de I'alignement) et de la p53 (ligne du bas) sont morceiees en 
peptides en fonction des exons respectifs a partir desquels ils sont 
codes. Les chiffres au niveau des fleches correspondent a la 
numerotation des exons correspondants. 

Figure 13: Sequence genomique humaine du SR-p70 depuis le 3' de Tintron 1 
jusqu'au 5' de I'exon 3. Les introns sont encadres. Aux positions 123 et 
133, sont locaiisees deux positions nucleiques variables (G -»> A en 123 
et C -> T en 133). Les sites de restriction de I'enzyme Styl -sont 
soulignes (position 130 dans te cas ou il y a presence d'un T au lieu d'un 
C 4 la position 133, position 542 et position 610). Les filches 
positionnent les amorces nucteiques utilisees dans Texemple XI. 

Figure 14 : Comparaison nucleique du 5 1 des ADNc humains du SR-p70d et du 
SR-p70a 



igure 15 : Multialignement des sequences nucleiques correspondant au SR-p70 
humain a, b, d, e, et f 



Figure 16 : Multi-alignement des protdines ddduites des ADNc SR-p70 humains (a, 
b, d, e et 0- 

Figure 17 : S6quence nucleique partielle et sequence proteique deduite partielle du 
SR-p70a humain. Les deux bases en caracteres gras correspondent a 
deux positions variables (voir figure 6). Cette sequence presente une 
region 5 1 non codante plus complete que celle presentee dans la figure 
6. 

Figure 18 : Analyse des transcrits SR-p70a apr^s amplification par PCR. 

piste M : marqueurs de poids moldculaires "1 kb ladder (GIBCO-BRL) 
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piste 1 : lignee HT29 
piste 3 : lignee SK-N-AS 
piste 5 : lignee UMR-32 
piste 7 : lignee U-373 MG 
piste 9 ; lignee SW 480 
piste 11 : lignee CHP 212 
piste 13 : lignee SK-N-MC 

pistes 2, 4, 6, 8, 10, 12, 14 : temoins negatifs correspondant aux pistes 
1. 3, 5, 7, 9, 11 et 13 respectivement (absence de transcriptase inverse 
dans (a reaction RT-PCR). 

Figure 19 : A : Analyse par electrophorese sur gel d'agarose des fragments 
genomiques amplifies par PCR (depuis le 3' de i'intron 1 jusqu'au 
5* de I'exon 3). La numerotation des pistes correspond a la 
numerotation de Techantillonnage temoin. Piste M : marqueurs de 
poids moleculaires f1 kb ladder"). 
B : Analyse identique a celle de la parte A apres une digestion par 
Tenzyme de restriction Styl des m^mes echantillons. 

Figure 20 : Representation schematique avec une carte de restriction partielle du 
plasmide pCDNA3 contenant le SR-p70a humain. 
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EXEMPLE I 

Clonage de I'ADNc du SR-p70 de cellules COS-3. 

1. Culture des cellules COS-3 

Les cellules COS-3 (cellules de rein de singe .vert d'Afrique transformees par 

I'antigene T du virus SV 40) sont cultivees dans le milieu OMEM (GIBCO-BRL refe- J 

rence 41 965-047) contenant 2 mM de L-glutamine et supplement avec 50 mg/l de 

gentamycine et de 5 % de serum de bovin foetal (GIBCO-BRL reference 10231-074) 

jusqu'a semi-conffuence. 

2. Preparation de I'ARN mess age r 
a) extraction de I'ARN messager 

Les cellules sont recup6rees de la fa9on suivante : 

- les cellules adhdrentes sont lavees deux fois avec du tampon PBS (phosphate ' 
buffered saline, reference 04104040-GIBCO-BRL) puis grattees avec un grattoir 
en caoutchouc et centrifugees. 
Le culot cellulaire est mis en suspension dans le tampon de lyse de composition 
suivante : guanidine-thiocyanate 4M ; citrate de sodium 25mM pH 7 ; sarcosyl 0,5 
% ; p-mercapto6thanol 0,1 M. La suspension est soniquee a I'aide d'un sonicateur 
Ultra-Turrax n° 231256(Janke et Kundel) a puissance maximale pendant une 
minute. On ajoute de ('acetate de sodium pH 4 jusqu'a 0,2 M. La solution est 
extraite avec un volume d r un melange phenol/chloroforme (v/v ; 5/1). On precipite 
a -20°C I'ARN contenu dans la phase aqueuse £ I'aide d'un volume d'isopropanol. ' 
Le culot est resuspendu dans le tampon de lyse. La solution est a nouveau extraite i 
avec un melange ph6nol/chloroforme et I'ARN est precipite avec de l isopropanol. 
Apr6s lavage du culot avec de »'6thanol 70 % puis 100 %. I'ARN est resuspendu 
dans de I'eau. 
b) Purification de la fraction poly A* de I'ARN 

La purification de la fraction poly A" de I'ARN est real i see a raide du kit Dynabeads 
°ligo (dT) 2S de DYNAL (reference 610.05) suivant le protocoie preconise par le 
fabricant Le principe est base sur ('utilisation de billes polystyrene super- 
paramagnetique sur lesquelles est attache un oligonucleotide poly(dT) 25 . La frac- 
tion poly A* de I'ARN est hybridee sur roligo(dT) 25 couple aux billes que Ton piege 
sur un support magnetique. 
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3. Constitution de la banque d'ADN complementaire 

a) preparation de I'ADN complementaire 

A partir de 0.5 \xg des ARN-poly A* de cellules COS-3 obtenus a Tissue de Tetape 
2, on prepare I'ADN complementaire simple-brin marque au 32 P.dCTP (I'ADN 
complementaire obtenu presente une activite specifique de 3000 dpm/ng) avec 
I'amorce synthetique de sequence suivante (comprenant un site BamHI) : 
5'<GATCCGGGCC CI I I I I I I I I TTT<y 

dans un volume de 30 de tampon de composition : Tris HCI 50 mM pH 8,3. 
MgCI 2 6 mM, DTT 10 mM, KCI 40 mM, contenant 0,5 mM de chacun des 
desoxynucleotides triphosphates, 30^iCi de dCTP a 32 P et 30 U de RNasin (prome- 
ga). Apres une heure d'incubation a 37°C ( puts 10 minutes a 50°C, puis de 
nouveau 10 minutes d 37°C, avec 200 unites de I'enzyme transcriptase inverse 
RNase H' (GIBCO-BRL reference 8064A). on ajoute 4 jil d'EDTA. 

b) Hydrolyse alcaline de la matrice ARN 

On ajoute 6 d'une solution de NaOH 2N t puis on incube pendant 5 minutes a 
65° C. 

c) Purification sur colonne sephacryl S400 

Afin d'eliminer I'amorce synthetique, on purifie I'ADN complementaire sur une 
colonne de 1 mt de sephacryl S400 (Pharmacia), equilibree dans du tampon TE. 
Les deux premieres fractions radioactives sont regroupees et precipitees avec 
1/10 de volume d'une solution dacdtate d'ammonium 10 M et 2,5 volumes 
d'ethanol, ceci apr£s une extraction, avec un volume de chloroforme. 

d) Addition homopolymdrique de dG 

On allonge I'ADN complementaire en 3' avec une "queue" de dG avec 20 unites de 
I'enzyme terminate transferase (Pharmacia 27073001). On incube dans 20 fil de 
tampon de composition : Tris HC! 30 mM pH 7,6 ; chlorure de cobalt 1mM ( acide 
cacodylique 140 mM. DTT 0 f 1mM ( dGTP 1 mM, pendant 15 minutes a 37°C, puis 
on ajoute 2 nl d'EDTA 0,5 M. 

e) On repete d nouveau tes etapes b) et c) 

0 Appariement du vecteur de clonage pSE1 (EP 506 574) et de I'ADN 
complementaire en presence de I'adaptateur. 

On centrifuge, le culot est dissous dans 33 \x\ de tampon TE, on ajoute 5 nl (125 
ng) de vecteur de donage pSE1, 1 ^(120 ng) de I'adaptateur de sequence sui- 
vante (comprenant un site Apal) : 
5AAAAAAAAAAAAAGGGCCCG3\ 
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10 nl d'une solution de NaCI 200 mM, on incube pendant 5 minutes a 65»C puis 
on laisse refroidir le melange reactronnel jusqu'a temperature ambiante. 
g) Ligation 

On ligue le vecteur de clonage et I'ADNc simple brin dans un volume de 100 ^ avec 
32,5 unites de Tenzyme ADN ligase du phage T4 (Pharmacia reference 270 87002) 
pendant une nuit a 15°C dans un tampon de composition : Tris HCI 50 mM pH 7,5, 
MgCl2 10 mM, ATP 1 mM. 
n) Synthese du deuxieme brin de I'ADNc 
On elimine les proteines par extraction au phenol suivie d'une extraction au 
chloroforme, puis on ajoute 1/10eme de volume d'une solution d'acetate d'ammo- 
nium 10 mM, puis 2,5 volumes d'ethanol. On centrifuge, le culot est dissous dans le 
tampon de composition Tris acetate 33 mM pH 7,9 acetate de potassium 62,5 mM, 
acetate de magnesium 1 mM et dithiothreitol (OTT) 1 mM. le deuxieme brin d'ADN 
complementaire est synthetise dans un volume de 30 n\ avec 30 unites de I'erizyme 
ADN polymerase du phage T4 (Pharmacia, reference 270718) et un melange de 1 
mM des quatre desoxynucleotides triphosphates de dATP, dCTP, dGTP et dTTP, 
ainsi que deux unites de la proteine du gene 32 du phage T4 (Pharmacia, reference 
27-0213)) pendant une heure a 37°C. On extrait au phenol et on retire les traces de 
phenol par une colonne de polyacrylamide P10 (Biogel P1 0-200-400 mesh - 
reference 1 501 1050 - Biorad). 
i) Transformation par electroporation 
On transforme des cellules E. Coli MC 1061 avec I'ADN recombinant obtenu 
precedemment par electroporation a I'aide de I'appareil Biorad Gene Pulser (Biorad) 
utilise a 2.5 kV dans les conditions preserves par le fabricant. puis on fait pousser 
les bacteries pendant une heure dans du milieu dit milieu LB (Sambrook op cite) de 
composition : bactotryptone 10 g/l ; extrait de levure 5 g/l ; NaC1 10 g/l. 
On determine le nombre de clones independants en etalant une dilution au 
1/1000eme de la transformation apres la premiere heure d'incubation sur une boite 
de milieu LB add.tionne de 1.5 % d'agar (p/v) et de 100 M /ml d'ampicilline, appele 
par la suite milieu LB gelose. Le nombre de clones independants est de 1 million, 
j) Analyse des ADNc de la banque 
Dans le cadre de ('analyse de clones individualises de la banque par un 
sequencage nudeique du 5' des ADNc. un clone, denomme SR-p70a s'est revele 
presenter une homologie partielle avec I'ADNc de la proteine deja connue, la 
proteine p53 (Genbank X 02469 et X 16384) (Figure 1). Les sequences ont ete 
realisees avec le kit United States Biochemical (reference 70770) et/ou le kit Applied 
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Biosystems (references 401434 et/ou 401628) qui utilisent la methode de Sanger et 
al., Proc. Natl. Acad. Sci. USA ; 1977. 14, 5463-5467. L'ADN plasmidique est 
prepare a partir du kit WIZARD mini preparation (Promega reference A7510). Les 
amorces utilisees sont des oligonucleotides de 16 d 22 mer, complementaires soit 
au vecteur pSE1 dans la region immediatement en 5* de I'ADNc, soit a la sequence 
de I'ADNc. 

Un second ADNc a ete isold d partir de la meme banque en criblant de maniere 
similaire a la technique d6crite dans I'EXEMPLE III 3) ci-apres avec un fragment de 
I'ADN SR-p70a marque au 32 P avec le kit BRL "Random Primers DNA labelling 
systems" (reference 18187-013). Les tampons d'hybridation et de lavage sont 
additionnes de 50 % de fomnamide. Le dernier lavage est realist en 0,1 x SSC/SDS 
0,1 % d 60°C. Gette seconde sequence (ADNc SR-p70b) est identique a la premiere 
mais presente un fragment interne delete {Figure 3). 

Les deux ADNc SR-p70, d'une longueur de 2874 nucleotides (SR-p70a) et de 2780 
nucleotides (SR-p70b) correspondent aux produits d'un seul gene, un epissage 
alternatif entrainant une deletion de 94 bases entre les nucleotides 1637 et 1732 et 
une terminaison prematuree de la proline codee correspondante. Les proteines 
deduites des deux ADNc presentent respectivement 637 acides amines et 499 
acides amines (Figures 4 et 5). 



EXEMPLE II 

Obtention de ta sequence et clonage de I'ADNc de la proteine SR-p70a £ partir de 
cellules HT-29 (Adenocarcinoma de colon humain). 

1) Culture des cellules HT-29 

Les cellules sont cultivees en milieu McCoy 5 (GIBCO 26600-023) additionne de 10 % 
de serum foetal de veau (GIBCO 10081-23) et 50 mg/l de gentamycine jusqu a semi- 
confluence. 

2) Preparation de I'ADN comptementaire 

L'ARN messager est prepare comme d6crit dans r EXEMPLE I.2. UADNc est prepare 
de maniere similaire £ celle decrite dans I'EXEMPLE 1. 3 avec 5 >ig d'ARN messager 
total en utilisant une amorce poly(T)i 2 - La reaction n*est pas interrompue avec de 
I'EDTA. 
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3) Amplification specifique de I'ADNc humain par la technique dite de PCR 
La polymerisation est realisee avec 4 M l d'ADNc dans 50 y\ final avec le tampon de 
composition suivante : Tris HCI 10 mM pH 8.3. MgCI, 2.5 mM. KCI 50 mM en 
presence de 10 % DMSO, dNTP 0.5 mM. 4 ng/ml de chacune des deux amorces 
nucleiques et de 2.5 unites de Taq ADN polymerase (Boehringer). Les couples 
d'amorces ont ete choisis sur fa sequence nucleique du clone SR-p70 de COS-3 
notamment en amont de I'ATG d'initiation et en aval du TGA d'arret de traduction et 
sont de compositions suivantes : 

amorce sens : ACT GGT ACC GCG AGC TGC CCT CGG AG 
site de restriction Kpn I 

amorce antisens : GAC TCTAGA GGT TCT GCA GGT GAC TCA G. 

site de restriction Xba I 

La reaction est realisee durant 30 cycles 94°C/1 minute, 54-60°C/1 minute 30 
secondes et 72 e C/1 minute 30 secondes. suivi d'un dernier cycle de 72°C/6 minutes. 

4) Obtention de la sequence de I'ADNc humain 

Dans un premier temps, le produit de PCR est elimine des oligonucleotides sur une 
colonne de sephacryl S400 puis dessale par chromatographie d'exclusion sur une co- 
lonne de polyacrylamide P10 (Biorad reference 1504144). Les reactions de 
sequencage sont realisees a I'aide du kit Applied Biosystems (reference 401628) 
avec des oligonucleotides specifiques de I'ADNc. La sequence obtenue est tres 
similaire a celle du SR-p70a de singe et la proteine deduite contient 636 acides 
amines (Figure 6). 

De maniere similaire, d'autres sequences issues de lignees ou de tissus humains ont 
ete obtenues pour la parte codante du SR-p70 humain, notamment a partir du 
poumon ou du pancreas. Les proteines deduites de ces sequences sont identiques a 
cedes obtenues pour la lignee HT-29. 

5) Clonage de I'ADNc humain dans le plasmide pCDNA3 (Invitmgen V 790-20) 
Le produit PCR obtenu en 3) ainsi que le plasmide sont digeres par les deux enzymes 
de. restriction Kpn I et Xba I puis purifies apres migration sur un gel d'agarose 1 % a 
I'aide du kit Geneclean (Bio 101 reference 3105). Apres ligation avec 100 ng d'insert 
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et 10 ng de vecteur et transformation (technique decrite dans I'EXEMPLE l.3.g et i, les 
clones recombinants sont verifies par sequengage a I'aide du kit Applied Biosystems 
cite ci-dessus. 

5 

EXEMPLE II! 

Clonage de I'ADNc du SR-p70 de souris a partir de cellules AtT-20 (tumeur 
hypophysaire) 

0 

1) Culture ceilufaire de la iignSe AtT-20 

Les cellules sont cultivees dans du milieu Ham F10 (GIBCO 31550-023) additionne de 
15 % de serum de cheval (GIBCO 26050-047) et de 2,5 % de serum foetal de veau 
(GIBCO 10081-073) et de 50 mg/l de gentamycine jusqu'a semi-confluence. 

2) Preparation da fa banque d'ADN compldmentaire 

La banque est realises comme dealt dans I'EXEMPLE I, 2) et 3) a partir des cellules 
cultivees ci-dessus. 

3) Cribtage de fa banque 

a) Preparation des membranes 

Les clones da la banque sont 6tal6s sur du milieu LB gelose (boites de petri diametre 
150) revdtu de membranes Biodyne A ( PALL reference BNNG 132). Apres una nuit a 
37°C, les clones sont transteres par contact sur de nouvelles membranes. Ces 
demieres sont traittes en les d6posant sur du papier Whatman 3 mm imbibe des 
solutions suivantes : NaOH 0.5 N, NaCI 1.5 M pendant 5 minutes puis Tris HCI 0.5 M 
pH 8 , NaCI 1.5 M pendant 5 minutes. Aprds un traitement a la proteinase K dans le 
tampon suivant : Tris HCI 10 mM pH 8 , EDTA 10 mM, NaCI 50 mM, SDS 0.1 %, 
proteinase K 100 pg/ml pendant une heure a temperature ambiante, les membranes 
sont lavees abondamment dans du 2 x SSC (sodium citrate NaCI), sechees, puis 
incubees au four sous vide a 80°C pendant 20 minutes. 

b) Preparation de la sonde 

Sur la base de sequences des ADNc SR-p70 de singe et d'humain. une premiere 
sequence a ete realises sur un fragment amplifie a partir de TARNm de la lignee AtT- 
20 comme decrit dans I'EXEMPLE II.3 et 4 avec les oligomeres de compositions 
suivantes : 
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amorce sens : GCC ATG CCT GTC TAC AAG 
amorce antisens : ACC AGC TGG TTG ACG GAG. 

Sur la base de cette sequence, une sonde oligomerique specifique de souris a ete 
choisie et presente la composition suivante : 
GAG CAT GTG ACC GAC ATT G. 

100 ng de la sonde sont marques en 3' avec 10 unites de Terminal Transferase 
(Pharmacia) et 100 uCi de dCTP a 32 P 3000 ci/mmole (Amersham reference PB 
10205) dans 10 pi du tampon suivant : Tris HCI 30 mM pH 7.6 . acide cacodylique 
140 mM. CoCI 2 1 mM. DTT 0.1 mM pendant 15 minutes a 37°C. Les nucleotides 
radiomarques non incorpores sont elimines sur une colonne de polyacrylamide P10 
(Biorad. reference 1504144). La sonde obtenue a une activite specifique environ de 
5.10 8 dpm/ug. 

c) Prehybridation et hybridation 

Les membranes preparees en a) sont prehybridees 30 minutes a 42°C dans 6 x SSC. 
5 x Denhart's. 0.1 % SDS puis hybridees quelques heures dans le meme tampon 
additionne de la sonde preparee en b) a raison de 10 6 dpm/ml. 

d) Lavage et exposition des membranes 

Les membranes sont lavees deux fois a temperature ambiante dans le tampon 2 x 
SSC/SDS 0.1 % puis une heure a 56°C en 6 x SSC/SDS 0.1 %. Les clones hybrides 
sont reveles avec des films KODAK XOMAT. Un clone positif contenant le SR-p70 de 
souris est selectionne et denomme ci-apres SR-p70c. 

4) Sequengage du SR-p70 de souris et analyse de la sequence 
La sequence est obtenue a I'aide du kit Applied Biosystem (reference 401628). La 
sequence proteique deduite de I'ADNc SR-p70c de souris (Figure 7) presente une 
tres forte homologie avec cedes de I'humain et de singe excepte dans la partie N- 
terminale qui diverge fortement (voir Figure 9). A I'aide de la technique dite de PCR 
de maniere similaire a celle decnte dans I'EXEMPLE II.3 et 4, une seconde sequence 
5' (issue de la meme banque AtT-20) a ete obtenue (Figure 8). La sequence 
proteique N-terminale deduite (sequence denomme SR-p70a) est tres similaire a celle 
deduite des ADNc SR-p70 humain et de singe (SR-p70a) (Figure 9). La lignee AtT-20 
presente done au moins deux transcripts SR-p70. Ces 2 demiers divergent dans la 
partie N-terminale par des epissages differents. 
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EXEMPLE IV 

1) Production de proteine recombinante SR-p70 dans E. coli 
a) Construction du plasmide d'expression 

Elle consists a mettre la partie -COOH terminale de la proteine SR-p70a de singe, 
depuis la valine en position 427 d ITiistidine -COOH terminale en position 637, en 
fusion avec la glutathione S-transferase (GST) du vecteur plasmidique pGEX-4T-3 
(Pharmacia reference 27-4583). Pour ceia, ('insert correspondant de la SR-p70a 
(position 1434 A 2066) a etd amplifie par PCR avec 10 ng de plasmide contenant 
I'ADNc SR-p70a de singe. Les amorces nucleiques sont de composition suivante : 

amorce sens : TTT GGA TCC GTC AAC CAG CTG GTG GGC CAG 
site de restriction BamHI 

amorce antisens : AAA GTC GAC GTG GAT CTC GGC CTC C. 
site Sal I 

Le fragment obtenu ainsi que le vecteur sont digeres par les enzymes de restriction 
BamHI et Sal I et le clonage est r£all$6 comme decrit dans r EXEMPLE II.5. Le clone 
selectionne est appeld pG SR-p70. 

b> Expression et purification de la proteine fusion GST-pSR-p70 

Cette etape a ete realises en utilisant le kit "bulk GST purification module" (Pharmacia 

Reference 27-4570-01). 

De mantere schdmatique, le clone recombinant a ete mis en culture a 37°C dans un 
litre de milieu 2x YTA + ampicilline 100 *ig/ml. A DO 0,8, Texpression est induite avec 
0,5 mM dMPTG pendant 2 heures i 37°C. Apr6s centrifugation, le culot cellulaire est 
repris dans du PBS froid puis soniqud par ultrason. Apres adjonctton de 1 % triton X- 
100, on incube 30 minutes sous agitation a temperature ambiante. Apres 
centrifugation a 12 000 g, 10 minutes £ 4°C. on recup6re le sumageant. La purifica- 
tion est ensuite realises sur une colonne de chromatographie d'affinite glutathion 
sepharose 4B. La fixation et le lavage sont realises en tampon PBS et lelution est 
realisee par competition avec du glutathion r*duit. La concentration finale est amenee 
a 300 jig/ml de proteine fusion. 
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2) Production de proline SR-p70a dans les cellules COS-3. 

Les cellules COS-3 sont transferees avec de I'ADN plasmidique pSE1 dans lequel a 
ete clone i'AONc de SR-p70a de singe (EXEMPLE 1.1) ou avec de I'ADN plasmidique 
du vecteur pSE1 en tant que temoin par la technique du DEAE Dextran : les cellules 
COS-3 sont ensemencees a 5 x irjS cellules par boite de 6 cm en milieu de culture 
contenant 5 % de serum de bovin foetal (EXEMPLE 1.1). Apres culture, les cellules 
sont rincees avec du PBS. On ajoute 1 ml du melange suivant : milieu contenant 6,5 
ug d'ADN, 250 ug/ml d e DEAE Dextran et 100 uM de chloroquine. Les cellules sont 
incubees a 37«C en 5 % C0 2 durant 4 a 5 heures. Le milieu est aspire, on ajoute 2 ml 
de PBS additionne de 10 % DMSO et les cellules sont incubees pendant una minute 
en remuant legerement les boites. Le milieu est a nouveau aspire et les cellules sont 
rincees deux fois avec du PBS. Les cellules sont alors incubees a 37'C avec du 
milieu contenant 2 % de serum de bovin foetal pendant la duree de ('expression qui 
est generalement de 3 jours. 

La proteine SR-p70a est alors analysee comme decrit dans I'EXEMPLE VI par 
i mmunoempreinte. 



EXEMPLE V 

Preparation d'anticorps specifiques 

150 ug de proteines de I'echantillon prepare selon I'EXEMPLE IV ont ete utilises pour 
immuniser un lapin (mile de 1,5 a 2 kg environ. New-Zealand). Les immunisations ont 
ete effectuees tous les 15 jours selon le protocols decrit par Vaitukaitis, Methods in 
Enzymology, 1981. 73. 46. Pour la premiere injection, un volume de solution antige- 
nique est emulsifie par un volume d'adjuvant complet de Freund (Sigma reference 
4258). Cinq rappels ont ete administres en adjuvant incomplet de Freund (Sigma 
reference 5506). 

EXEMPLE VI 

Detection de la proteine SR-p70 "Western immunoblotting" (immunoempreinte) 

V Materials utilises pour I'immunoempreinte 

a) Lignees cellulaires utilisees pour I'immunoempreinte. 

Les lignees cellulaires suivantes ont ete cultivees. comme decrit dans le catalogue 
catalogue of cell lines and hybridomas. 7th edition. 1992» de I'ATCC (American Type 
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Culture Collection) ; COS-3, CV-1 (lignee de cellules de rein de singe). HT-29. U- 
373MG (glioblastoma humain), MCF7 (adenocarcinome mammaire humain), SKNAS 
(neuroblastome humain cultive dans les memes conditions que COS-3), SK-N-MC 
(neuroblastome humain), IMR-32 (neuroblastome humain), CHP212 (neuroblastome 
humain cultive dans les memes conditions que CV-1), Saos-2 (osteosarcome), SK- 
OV-3 (adenocarcinome d'ovaire) et SW 480 (adenocarcinome de colon humain). 
b) Cellules COS-3 transferees par i'ADNc SR-p70a. 

Les cellules COS-3 ont et6 transfectees comme decrit dans I'EXEMPLE IV.2. En tant 
que temoin, les cellules ont ete transfectees avec de I'ADN plasmidique pSE1 ne 
contenant pas I'ADNc recombinant SR-p70a. 

2) Preparation des echantillons proteiques d partir de culture ceftulaire eucaryote ou 
de cellules transfectees. 

Apres culture, les cellules sont lavees avec du PBS puis reprises dans un tampon 
RIPA (PBS avec 1 % NP40, 0,5 % sodium d6oxycholate, 0,5 % SDS) compldmente 
avec 10 ng/ml RNAse A, 20^ig/ml DNAse 1, 2 \igim\ aprotinine, 0,5 ^g/ml leupeptine, 
0,7 *ig/ml pepstatine et 170 >ig/ml PMSF. Les cellules sont soniquees par ultrason a 4 
°C et laissees 30 minutes d 4°C. Apres microcentrifugation a 12 000 rpm, on recupere 
le sumageant. La concentration de proteine est mesuree par ta methode de Bradford. 

3) "Western blotting 11 

5 ou 50 \ig de proteines (50 ug pour les lignees cellulaires et 5 ug pour des cellules 
transfectees) sont mis dans 0,2 volume du tampon d'6lectrophorese 6X suivant : Tris 
HCI 0,35 mM pH 8,8 10,3 % SDS, 36 % glycerol, 0,6 mM DTT, 0.012 % bleu de 
bromophenol. Les echantillons sont ddpos6s et mis a migrer dans un gel SDS-Page 
10 % (30/0,8 Bis) puis 6lectrotransferes sur une membrane de nitrocellulose. 

4) Revelation par f'anticorps 

La membrane est incubee 30 minutes dans le tampon de blocage TBST (Tris HCI 10 
mM pH 8, NaCI 150 mM, 0,2 % Tween 20) additionne de 5 % de lait (GIBCO- SKIM 
MILK) a temperature ambiante. La membrane est successivement mise en presence 
de I'anticorps anti-SR-p70 (<xSR-p70) dans le meme tampon 16 heures d 4°C, lavee 3 
fois pendant 10 minutes avec du TBST, puis incubee une heure & 37 e C avec un 
second antfcorps anti-immunoglobuline de lapin coupld avec de la peroxydase 
(SIGMA A055). Apr6s trois lavages de 15 minutes, la relation est effectuee en utiii- 
sant le kit ECL (Amersham RPN2106) par chimioluminescence. 
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Parallelement, les mimes echantiilons ont ete reveles par un anticorps anti-p53 (a 
p53) (sigma BP5312) suivi d'un second anticorps antMmmunoglobine de souris. 

5) Figures et rdsuftats. 

Figure 10 : Immunoempreinte de fa proteine SR-p70 

Figure 10a : Detection de la proteine recombinante SR-p70 

- colonnes 1 et 3 : COS-3 transfectee par le vecteur pSE1. 

- colonnes 2 et 4 : COS-3 transfectee par le plasmide pSE1 contenant I'ADNc du 
SR-p70a. 

- colonnes 1 et 2 : Revelation par I'anticorps anti-SR-p70 (aSR-p70). 

- colonnes 3 et 4 : Revelation par i'anticorps anti-P53 (ap53). 
Figure 10b : Detection de la proteine endogene SR-p70 

- colonnes 1 : COS-3 ; 2 : CV-1 ; 3 : HT-29 ; 4 : U-373 MG ; 5 : MCF7 ; 6 : SKNAS ; 7 
: SK-N-MC ; 8 ; IMR-32 ; 9 : CHP212 ; 10 : Saos-2 ; 1 1 : SK-OV-3 et 12 : SW480. 

A : Revelation par i'anticorps aSR-p70. 
B : Revelation par I'anticorps <xp53. 

L'anticorps aSR-p70 reconnait specifiquement les prolines recombinantes (Figure 
10a) et endogfcnes (Figure 10b) et ne croise pas avec la p53. Uanalyse de lignees 
cellulaires humaines ou de singe montre que la proteine SR-p70 comme la p53 est 
generalement faiblement detectable. Par contre, lorsqu'une accumulation de p53 
existe, la SR-p70 deyient elle aussi plus facilement detectable (Figure 10b). Une 
etude par RT-PCR de la distribution des transcrits SR-p70 montre que le gene est 
exprime dans tous les types cellulaires testes. 



EXEMPLE VII 

Clonage du gene du SR-p70 et localisation chromosomique. 
1) Clonage du gdne SR-p70 

La banque utilisee est une banque de cosmides, preparee avec de I'ADN genomique 
humain purifie de placenta, et commercialisee par Stratagene (reference 95 1202). 
Le criblage du gene est realise comme decrit dans Texemple itl.3 avec un fragment 
d^ADN SR-p70 marque au 32 p avec , e kit QRL « Random pnmers DNA Labelling 
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Systems*' (reference 18187-013). Les tampons d'hybridation et de lavage sont 
additionnes de 50 % formamide. Le dernier lavage est realise en 0,1 x SSC/SDS 
0,1 % a 60°C. De maniere similaire, le gene SR-p70 a ete isole a partir d'une banque 
preparee avec de I'ADN genomique de la souris black C57. 

Une analyse et un sequen$age partiel des clones mettent en evidence la presence de 
14 exons avec une structure proche de celle du gene p53, notamment dans la partie 
centrale ou la taille et le positionnement des exons sont tres conserves (Figure 12). 
Cette structure a ete definie partiellement chez la souris et chez I'homme. 
A titre d'exemple, les sequences genomiques humaines du 3* de Tintron 1 r de I'exon 
2, de I'intron 2, et du 5* de Texon 3 sont presentees dans la figure 13. 

2) Localisation chromosomique du g&ne SR-p70 chezi'homme 

Elle a et6 realisde avec de I'ADN du gene SR-70 humain en utilisant la technique 
decrite par R. Slim et al„ Hum. Genet., 1991, 88, 21-26. Cinquante mitoses ont ete 
analysees dont plus de 80% avaient des doubles spots localises en 1p36 sur les deux 
chromosomes et plus parttculierement en 1p36.2 -1p36.3 (Figure 11), L'identification 
du chromosome 1 et son orientation sont basees sur I'heterochromatine de la 
constriction secondare. Les images ont 6t6 faites sur un microscope Zeiss Axiophot, 
saisies par une camera CCD refroidie LHESA et traitees par Optilab. 



EXEMPLE VIII 

A) Mise en Evidence d'un ARNm codant pour une proteine SR-p70 humaine deduite 
presentant a la fois une extremite N-tenminale plus courte et une divergence. 

1) Cultums des cellules IMR-32 (neuroblastoma humain) 

Les cellules ont ete cultlvdes comme decrit dans le catalogue "catalogue of cell lines 
and hybridomas, 7th edition, 1992" de TATCC (American Type Culture Collection). 

2) Preparation de I'ADNc 

UARN est prepare comme decrit dans I'exemple l.2.a. L'ADNc est prepare de maniere 
similaire a celle d6crite dans I'exemple I.3 avec 5 M g d'ARN total dans un volume final 
de 20 pi en utilisant une amorce poly (T) 12 et avec des nucleotides froids. La reaction 
n'est pas interrompue avec de I'EDTA. 
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3) Amplification specifique de I'ADNc SR-P70 par la technique d,te de PCR 

La polymerisation est realisee avec 2 pi d'ADNc dans 50 pi final avec le tampon de 

composition suivant : Tris HCI 50 mM pH 9.2. 16 mM (NH 4 ) 2 S0 4 . 1.75 mM MgCI 2 . 

en presence de DMSO 10%, de NTP 0.4 mM. de 100 ng de chacune des deux 

amorces nucleiques et de 3.5 unites du melange des Taq et PWO polymerases 

(Boehringer Mannheim, ref. 1681 842). 

Le couple d'amorce est de composition suivante : 

amorce sens : AGGCCGGCGTGGGGAAG (position 16 a 32. Figure 6) 
amorce antisens : CTTGGCGATCTGGCAGTAG (position 503 a 485. Figure 6). 

La reaction est realisee durant 30 cycles a 95 s C/30 secondes. 58°C/1 minute et 
68 a C/2 minutes 30 secondes suivi d'un dernier cycle de 68°C/10 minutes. 

Le produit PCR est soumis a una electrophorese sur un gel d'agarose 1% (tampon 
TAE). Apres coloration au bromure d'ethidium, deux bandes majeures sont revelees : 
une bande d'une taille d'environ 490 pb (taille attendue (voir Figure 6)) et une bande 
supplemental d'une taille d'environ 700 pb. Cette demiere est extraite du gel a I'aide 
du kit "geneclean" (Bio 101. ref 1001 400). Apres un dessalage sur une colonne de 
polyacrylamide P10 (Biorad. ref 15011050). le fragment est soumis a une nouvelie 
amplification par PCR durant 10 cycles comma decrit d-dessus. 

4) Determination de la sequence du produit ampliM 

Dans un premier temps, le produit PCR est elimine des oligonucleotides sur une 
colonne de sephacryl S400 (Pharmacia 17-0609-01) puis dessale sur une colonne de 
P10. La reaction de sequencage est realisee a I'aide du kit Applied Biosystems (ref. 
401 628) (373 DNA sequencer) avec I'amorce antisens. 

La sequence obtenue est identique a la sequence de I'ADNc SR-p70 (exemple II.4) 
avec une insertion de 198 pb entre les positions 217 et 218 (Figure 14). La sequence 
proteique N-terminale deduite (sequence denommee SR-p70d) est plus courte de 49 
acides amines avec une divergence des 13 premiers acides amines (sequence ID 
N°13). II y a done co-existence d'au moins deux transcrits differents SR-p70 comme 
deja decrit pour la lignee AtT-20 de souris. 
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B) Clonage du SR-p70 humain et mise en evidence d'un ARNm codant pour une 
proteine SR-p70 humaine deduite presentant la meme extremite N-terminale que ie 
SR-p70d et une divergence dans la partie C-terminale 
1) Amplification specifique de I'ADNc du SR-p70 par la technique dite de PCR 

L'amplifrcation a ete realisee comme decrit dans I'EXEMPLE VIILA a partir d'ARN 
purifie des cellules IMR-32 avec le couple d'amorces de composition suivante: 

amorce sens : GCG GCC ACG ACC GTG AC (position 160 a 176, sequence 

IDN°11) 

amorce antisens : GGC AGC TTG GGT CTC TGG (position 1993 a 1976, 
Figure 6). 

Apr6s elimination de I'exces d'amorces sur colonne S400 et dessalage sur colonne 
P10. 1pl de lechantillon est de nouveau soumis a une PCR avec le couple d'amorces 
de composition suivante : 

amorce sens : TAT CTC GAG CTG TAG GTC GGT GAC CCC 

Xho I (position 263 a 280, sequence ID 

N° 11) 

amorce antisens : ATA TCT AGA TCA GTG GAT CTC GGC CTC 

Xba 1 (position 1943 a 1926, Figure 6). 

2) Clonage du produit amplifie dans le plasmide pCDNA3 

Le produit PCR obtenu en 1) est dessal6 sur colonne P10, digere par les enzymes de 
restriction Xho I et Xba I, puis clone dans le plasmide pCDNA3 comme decrit dans 
I'EXEMPLE II.5 , Deux donas recombinants sont sequenc6s a laide du kit Applied 
Biosystems avec les oligonucleotides specifiques de I'ADNc du SR-p70. 
La premiere sequence obtenue correspond a la s6quence complete de I'ARNm 
codant pour le SR-p70 ddcrit dans I'EXEMPLE Vill a .La prpteine d6duite comporte 
587 acides amines (sequence ID N° 13 et Figure 16). 

La seconde sequence obtenue est identique a la sequence de r ADNc de SR-p70d 
decrite ci-dessus mais avec deux deletions de 149 pb et de 94 pb entre les positions 
1049 et 1050 d'une part et entre les positions 1 168 et 1 189 d'autre part (sequence ID 
N° 14 et Figure 15). La sequence protetque deduite de cette seconde sequence 
revile une proteine ayant une partie N-terminale plus courte de 49 acides amines 
avec une divergence dans les 13 premiers acides amines ainsi qu'une divergence de 
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sequence proteique entre Jes acides amines 350 et 397 (sequence ID NT 15 et Figure 
16) (sequence denommee SR-p70e). La proteine deduite comporte 506 acides 
amines. 

C) Mise en evidence d'un ARNm codant pour une proteine SR-p70 humaine deduite 
presentant une extremite N-terminale plus courte 

1) Culture des cellules SK-N-SH (neuroblastome humain) 

Les cellules sont cultiv6es comme d6crit dans fe « catalogue of cell lines and 
hybridomas, 7th edition, 1992 » de I'ATCC (American Type Culture Collection). 

2) Preparation de I'ADNc et amplification de I'ADNc du SR-p70 par la technique dite 
de PCR 

Ces etapes sont realisees comme decrit dans iEXEMPLE VIII.A avec le couple 
d'amorces de composition suivante: 

amorce sens : AGG GGA CGC AGC GAA ACC (position 128 a 145, Figure 

17) 

amorce anti sens :GGC AGC TTG GGT CTC TGG (position 1993 a 1976, Figure 

6). 

Le sequence est realise avec le kit Applied Biosystem avec des amorces 
specifiques de I'ADNc du SR-p70 et revele deux ADNc : 

- un premier ADNc correspondant d I'ARNm codant pour le SR-p70a 

- un second ADNc presentant une delation de 98 pb entre les positions 24 et 25 
(sequence ID N° 16 et Figure 15). 

Cette d£l£tion comprend I'ATG d'initiation de traduction du SR-p70a. La proteine 
deduite (denommee SR-p70f) de ce second ADNc presente un ATG initiateur de 
traduction en aval correspondant d un ATG interne du SR-p70a. La proteine deduite 
comporte done 588 acides amines (sequence ID N° 17 et Figure 16) et est tronquee 
des 48 acides amines N-terminaux du SR-p70a, 

D) Mise en Evidence d'un ARNm codant pour le SR-p70b humain. 
1) Culture des cellules K562 
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Les cellules sont cultivees comme decrit dans le "catalogue of cell lines and 
hybridomas, 7 th edition, 1992" de I'ATCC (American Type Cylture Collection). 

2) Preparation de i'ADNc, amplification de I'ADNc du SR-p70 par la technique dite de 
PCR et sequen9age. 

Ces etapes sont rgalisees comme decrit dans I'EXEMPLE VIII. C. 
Le sequen^age revele deux AONc : 

Un premier ADNc correspondant a I'ARNm codant pour le SR-p70a et un second 
ADNc presentant une deletion de 94 pb entre les positions 1516 et 1517 (sequence 
ID N° 18 et Figure 15). La prot6ine deduite (denommee SR-p70b) comporte 199 
acides amines et presente une sequence C-terminale tronquee de 137 acides amines 
par rapport au SR-p70a avec les 4 demiers acides amines divergents (sequence ID 
N° 19et Figure 21). 

Cet ADNc est similaire £ celui d6crit dans I'EXEMPLE I relatif au SR-p70b de singe. 

Les molecules decrites dans cet exemple (EXEMPLE VIII. A. B. C. et D) mettent en 
evidence des variants du SR-p70 consecutifs a des epissages differentiels de I'ARNm 
primaire transcrits par le gene SR-p70. 

Le SR-p70a est cod£ par un ARNm compose de 14 exons (voir EXEMPLE VII). C'est 
la proteine de reference. Le SR-p70b est cons6cuttf £ une insertion entre les exons 3 
et 4 et £ ('absence des exons 11 et 13. Le SR-p70f est consecutif £ l absence de 
I'exon 2. Cet exemple decrit t'existence de variants du SR-p70 de maniere non 
exhaustive, avec une probability forte d'existence d'autres variants. De meme, 
lexistence de ces variants ddcrits dans cet exemple ainsi que le SR-p70a ne se limite 
pas aux iignees dans lesquelles ils ont ete mis en evidence. En effet des etudes 
effectuees par RT-PCR ont montre que ces variants sont retrouves dans les diverses 
ligndes dtudiees. 

De plus, la methionine d'initiation du SR-p70f correspond a une methionine interne du 
SR-p70a, suggdrant la possibility d'initiation en aval sur I'ARNm codant pour le SR- 
p70a. 
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EXEMPLE IX 



Obtention d'une sequence 5' de I'ARNm SR-P70a humaine. 



1) Amplification de I'extremite de 5'de f'ADNc SR-P70 parPCR 

La culture cellulaire et tes preparations d'ARN total et d'ADNc sont realisees comma 
decrit dans I'EXEMPLE VIII. 1 et 2. La matrice ARN est hydrolysee par incubation 5 
minutes a 65*0 apres adjonction de 4 pi EDTA 500 mM et 4 pi NaOH 2N. 
Lechantillon est ensuite dessald surcolonne P10. L'ADNc est allonge en 3' avec une 
"queue" de dG comma decrit dans I'EXEMPLE l.3.d, dans un volume final de 40 pi. 
Apr6s adjonction de 4 pi EDTA 500 mM et 4 pi NaOH 2N t I'ADNc est incube a 65°C 
pendant 3 minutes puis dessale sur une colonne P10. L'amplification par PCR est 
realisee comme d6crit dans r EXEMPLE VIII.3 avec 8 pi d'ADNc et durant 30 cycles 
avec le couple d'amorces de composition suivante : 

amorce sens : CCCCCCCCCCCCCCN(ouNest egal £ G.A ou T) 
amorce antisens : CCATCAGCTCCAGGCTCTC (position 1167 a 1149 Figure 
6). 

Apres elimination de Texces d'amorces sur colonne S400 et dessalage sur colonne 
P10, 1 pi de I'echantillon est de nouveau soumis a un PCR avec le couple de 
composition suivante : 

amorce sens : CCCCCCCCCCCCCCN 

amorce antisens : CCAGGACAGGCGCAGATG (position 928 a 91 1 , Figure 6), 

Lechantillon, de nouveau passe sur une colonne S400 et une colonne P10, est 
soumis £ une troisieme amplification durant 20 cycles avec le couple suivant : 
amorce sens : CCCCCCCCCCCCCCCN 

amorce antisens : CTTGGCGATCTGGCAGTAG (position 503 £ 485, Figure 6). 
2) Determination de ta sequence 5' ADNc SR-P70 

La sequence est realisee comme decrit dans I'EXEMPLE VIII.4). Cette sequence fait 
apparaitre un 5' non codant d'au moins 237 bases en amont de I'ATG d'initiation du 
SR-p70a (Figure 17). Par comparison de cette sequence (obtenue a partir de la 
lignee IMR-32) avec cede obtenue a partir de la lignee HT-29 notamment (Figure 6), 
deux differences ponctuelles (Figure 17 : voir caracteres gras) sont mises en 
evidence (G A et C -» T) respectivement positionne a -20 et -30 de I'ATG 
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d'initiation du SR-p70a (Figures 6 et 17). Cette variabilite est situee au niveau de 
I'exon 2 (Figure 13). II n'est pas exciu que cette variabilite se retrouve egalement a 
I'interieur d'une phase codante consecutivement a un epissage aiternatif comme 
decrit dans les EXEMPLES III chez la souris et VIII chez I'homme ou bien 
consecutivement a une initiation de la traduction sur un CTG (comme cela a ete 
demontre pour le FGFb (Proc. Natl. Acad. Sci USA. 1989, 86, 1836 - 1840). 
De meme. il n'est pas exclu que cette variabilite ait une implication sur la traduction du 
SR-p70 ou sur l epissage de I'ARN primaire. 

En tout etat de cause, cette variabilite. probablement tforigine allelique, peut servir de 
marqueur sott au niveau genomique (voir EXEMPLE XI). soit au niveau de I'ARNm 
(voir EXEMPLE X). 

EXEMPLE X 

1) Analyse par PCR, da I'expression transcriptionnelle du SR-P70a dans les 
echantiilons cellulaires (RT- PCR) 

Les cultures cellulaires (SK-N-AS. SK-N-MC. HT-29. U-373MG, SW480. IMR-32. 
CHP212) sont realisees comme decrit dans I'exemple Vl.l.a (referees au catalogue 
"catalogue of cell lines and hybridomas. 7th edition" 1992 de I'ATCC). 
La preparation de I'AONc et I'amplification par PCR sont realisees comme decrit dans 
I'exemple VIII.2 et 3. Le couple d'amorce utilise est de composition suivante : 
amorce sens : AGGGGACGCAGCGAAACC (position 128 a 1 45. Figure 1 7) 
amorce antisens : GGCAGCTTGGGTCTCTGG (position 1993 a 1976 Figure 
6). 

Les echantiilons sont analyses par eiectrophorese sur un gel d'agarose 1% et 
revelation au Bromure d'ethidium (Figure 18). 

La taille de la bande obtenue dans les echantiilons correspond a la taille attendue 
(environ 2 kb, Figures 6 et 17). L'intensite des bandes obtenues est reproductible 
Une reamplification de 1 M | de I'echantillon dans les memes conditions durant 20 
cycles fait apparaitre une bande dans chacun des echantiilons. 

2) Determination de la sequence des produits amplifies 

Apres passage des echantiilons sur colonnes S400 et P10. le sequencage est realise 
sur le sequencer 373 de Applied Biosystems avec ie kit de reference 401 628. Les 
amorces utilisees sont entre autres les suivantes : 



(C) 2000 Copyright Derwent Information Ltd. 



I 



WO 97/28186 



PCT/FR97/00214 



35 



10 



15 



AGGGGACGCAGCGAAACC 
CTTGGCGATCTGGCAGTAG 
GATGAGGTGGCTGGCTGGA 
CCATCAGCTCCAGGCTCTC 
TGGTCAGGTTCTGCAGGTG 
GGCAGCTTGGGTCTCTGG 



position 
128 a 145 
503 a 485 
677 a 659 
1167 a 1149 
1605 a 1587 



figure 
22 
6 
6 
6 
6 
6 



1993 a 1976 

Aucune difference proteique du SR-p70a n'a ete decelee. Cependant, les sequences 
obtenues font apparaitre una double variabilite aux positions -20 et -30 en amont de 
I'ATG.d'initiation du SR-p70a (Figures 6 et 17). Cette variabilite, probablement 
d'origine allelique. permet de definir deux classes de transcrits . une premiere classe 
presentant un G a la position -30 et un C a la position -20 (classe G-30/C-20) et une 
seconde classe presentant une difference aux deux positions : un A en -30 et un T en 
-20 (classe a*30/t-20) 

Premiere classe : SK-N-AS. SK-N-MC, HT-29. U-373MG, SW480. 
Deuxieme classe : IMR-32, CHP212. 



EXEMPLE XI 



20 



Methode d'analyse pour la determination de la repartition allelique du gene SR-p70 
dans un echantillonnage de 10 personnes. 

Cette repartition allelique est basee sur la variabilite allelique mise en evidence dans 

les examples IX etX: ' 

• Allele G-30 /c -20 presentant respectivement un G et un C aux positions .30 et -20 ' 
en amont de I'ATG d'initiation du SR-p70a. 

• Allele A-30/T-20 presentant respectivement un A et un T aux memes positions. 
Cette variabilite peut etre mise en evidence par ('utilisation d'enzymes de restriction 
differencial les deux alleles (Figure 13). A litre d'exemple : 

• Enzyme Bpl I presentant un site de coupure uniquement sur ('allele G'30/c-20 
dans la zone d'interet (ce site englobe les deux positions variables). / 

• Enzyme Styl presentant un site de coupure uniquement sur ('allele a-30/t-20 dans 
la zone d'interet. 
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1) Amplification genomique de lexon 2 parPCR 

La reaction de polymerisation est realisee, avec 500 ng d'AON genomique purifie. 
dans 50 ul final avec les conditions decrites dans I'exemple VIII.3. 
Le couple d'amorces est de composition suivante : 

amorce sens : CACCTACTCCAGGGATGC (position 1 a 18. Figure 13) 

amorce antisens : AGGAAAATAGAAGCGTCAGTC (position 833 a 81 3. Figure 1 3). 

La reaction est realisee durant 30 cycles comme decrit dans I'EXEMPLE VIII.3. 
Apres elimination de I'exces d'amorce sur une colonne S400 et dessalage sur une 
colonne de P10. 1 ul de I'echantillon est ampfifie de nouveau durant 25 cycles dans 
les memes conditions avec le couple d'amorces suivant : 

amorce sens : CAGGCCCACTTGCCTGCC (position 25 a 32. Figure.13) 

amorce antisens : CTGTCCCCAAGCTGATGAG (position 506 a 488. Figure 13). 

Les produits amplifies sont soumis a une efectrophorese sur un gel d'agarose 1% 
(Figure 19-A). 

2) Digestion par I'enzyme de restriction Styl 

Les echantillons sont au prealable dessales sur une colonne P10 puis digeres par 
I'enzyme de restriction Styl (BRL 15442-015) dans le tampon de composition suivant : 
Tris HCI P H 8. 50 mM, NaCI 100 mM, MgCI 2 10 mM. a 37'C pendant 30 mn. Les 
produits de digestion sont analyses par electrophorese sur un get d'agarose 1% 
(tampon TAE). La revelation est realisee par coloration au bromure d'ethidium 
(Figure 19-B). 

Une bande de 482 paires de bases caracterise ('allele G-30/ C -20 (Figures 13 et 19). 
La presence d'une bande de 376 paires de bases et d'une bande de 106 paires de 
bases caracterisent ('allele A-30/T-20 (aflele pr e Sen tant un site de coupure Styl). 
Sur I'echantillonnage de 10 personnes, 2 personnes presentent les alleles G- 3 °/C- 20 
et A-30/T-20 tes 8 autres per sonnes etant homozygotes avec I'allele G"30/c-20 
L'etude d'un nouvel echantillonnage de 9 personnes a mis en evidence 3 personnes 
heterozygotes presentant les alleles G-30/ C -20 et A-30/T-20, | es 6 autres personnes 
etant homozygotes pour I'allele G-3 0 /C- 20 
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EXEMPLE XII 

Test de reversion de transformation de la lignee SK-N-AS par transfection avec 
I'ADNc SR-p70. 

Le vecteur ^expression utilise est decrit dans I'EXEMPLE 11.5 et schematise dans la 
figure 15. La methode utilises est celle dite du phosphate de calcium decrite par 
Graham et al. (Virology 1973. 54, 2. 538-539). La lignee est ensemencee a raison de 
5.10 s cellules par boite de 6 cm de diametre dans 5 ml du milieu decrit dans 
rexemple I.1.. Les cellules sont mises en culture a 37°C et a 5% de C0 2 pendant une 
nuit. Le milieu de transfection est prepare de la maniere suivante : le melange suivant 
est realise en ajoutant dans I'ordre 1 ml de tampon HEBS (NaCI 8 mg/ml, KCI 370 
ug/ml. Na 2 HP0 4 -2H 2 0 125 ug/ml, Dextrose 1 mg/ml, Hepes pH 7,05 5 mg/ml). 10 ug 
du plasmide a transfecter et 50 M l CaCI 2 2.5 M ajoute goutte a goutte. Le milieu de 
transfection est laisse 30 mn a temperature ambiante puis ajoute goutte a goutte sur 
le milieu contenu dans la boite de culture. Les cellules sont incubees 5 a 6 heures a 
37" C/5% C0 2 . Apres aspiration du milieu. 5 ml de milieu frais contenant 2% de 
serum du bovin foetal sont ajoutes. Apres 48 heures a 37° C/5% C0 2 . les cellules 
sont rincees avec du PBS. decollees par trypsinisation. diluees dans 10 ml de milieu 
de culture (5% serum de bovin foetal) et etalees dans une boite de 10 cm de diametre 
(la dilution peut etre ajustee en fonction de I'efficacite de transfection). Apres une 
nouvelle incubation durant 10 heures (le temps que les cellules adherent), les cellules 
sont passees en selection par adjonction de G418 a la concentration finale de 600 
MQ/ml equivalent geneticine durant 15 a 21 jours (le milieu est change tous les jours). 
Les clones obtenus sont alors rinces au PBS, fixes a rethanol 70%, seches. colores 
avec 1 % de cristal violet puis comptabilises. 
Quatre transfections plasmidiques ont ete realisees en double : 

- plasmide pCDNA3 sans insert 

- plasmide pCDNA3/SR-p70 contenant I'ADNc - SR-P70a humaine 

- plasmide P CDNA3/SR-p70 Mut contenant I'ADNc - SR-p70a presentant une 
mutation a la position 293 AA (R -> H) qui est analogue a la mutation 273 (R 
H) dans le domaine de fixation a I'ADN de la p53 

- temoin sans plasmide. 

Le resultat est exprime en nombre de clones par boite. 
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Experience 1 


Experience 2 


Moyenne 


PCDNA3 


172 


353 


262 


PCDNA3 / SR-p70 


13 


8 


10 


pCDNA3 / SR-p70 mut 


92 


87 


89 


Absence de plasmide 


1 


3 


2 



Le nombre de clones obtenu par transfection avec te plasmide pCDNA3/SR-p70 est 
de 25 fois inferieur au nombre de clones obtenu avec le temoin pCDNA3 et de 9 fois 
inferieur au nombre de clones obtenu avec le pcDNA3/SR-p70 Mut, indiquant une 
mortalite ou un arret de division cellulaire des cellules transferees par I'ADNc SR- 
P70. Ce resultat n'est pas la consequence d'une toxicite au vue des clones obtenus 
avec I'ADNc SR-p70 mute mais probablement d'une apoptose comma ceia a ete 
demontre pour la proteine p53 (Koshland et a/., Sciences, 1993. 262, 1953-1981). 

EXEMPLE XIII 



R6le biologique de la proteine SR-p70. 

L'homologie de structure entre le domaine de fixation a I'AON de la p53 et la region 
centrale de la proteine SR-p70 permet d'inferer que la SR-p70 est un facteur de 
transcription (cf. Figures 1 et 2). En effet, la p53 (393 acides amines) est constitute 
de plus>eurs domaines fonctionnels. La region N-terminale (1-91 acides amines) est 
impliquee dans I'activation de la transcription, et contient des sites d'interaction a 
differentes proteines cellulaires et virales. La parte centrale (acides amines 92 a 292) 
permet la fixation aux sequences d'ADN specifiques situes dans les regions 
promotrlces de certains genes (la majorite des mutations ponctuelles inactivant la p53 
sont localises dans cette region), elle presente egalement de nombreux sites 
drnteracbon avec des proteines virales qui inhibent son activite. Enfin les 100 
dem.ers acides amines de la P 53 sont responsables de son oligomerisation ainsi que 
de la regulation de celle-ci (Hainaut P.. Current Opinion in Oncology. 1995, 7. 76-82 
Prokocimer M., Blood. 1994. 84 n'8, 2391-2411). 

L homologie de sequence entre p53 et SR-p70 est significative notamment en ce qui 
conceme les acides amines impliques directement dans rinteraction a I'AON 
suggerant que la SR-p70 se fixe aux sites p53 sur I'ADN. Ces acides amines 
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correspondent Ires exactement a ce qu'on appelle les "hot spot", acides amines 
frequemment mutes dans les tumeurs humaines (SWISS PROT : SW ■ P53 human et 
Prokocimer M.. Blood, 1994. 84 n'8. 2391-241 1). De cette homologie. on peut deduire 
que la proteine SR-p70 exerce un controle sur I'activite des genes regules par la p53. 
soit independamment de celle-ci soit en formant des heterooligomeres avec cette 
derniere. 

En consequence, a I'instar de la p53. les produits du gene SR-p70 doivent etre / 
impliques dans le contr&le et la regulation du cycle cellulaire provoquant des arrets 
du cycle (momentanes ou definitifs). et la mise en oeuvre de programmes tels que : la ' 
reparation de I'ADN. la differentiation ou la mort cellulaire. L'existence d'activites 
"p53-like' avait ete fortement pressentie avec la mise en evidence chez les souris 
P53-/-. d'activites de reparation de I'ADN et de mort cellulaire en reponse aux 
radiations ionisantes (Strasser et a/., Cell. 1994. 79, 329-339). Les auteurs de la 
presente invention ont localise le gene SR-p70 humain dans la region telomerique du 
bras court du chromosome 1. predsement en 1p36.2-36.3. la plus petite region ' 
deletee (SRO) commune a une majorite de neuroblastomes et d'autres types de 
tumeurs (melanomes et carcinomes) (White et a/., PNAS, 1995, 92, 5520-5524). 
Cette region de perte d'heterozygotie (LOH) delimite le locus d'un gene suppresseur 
de tumeur dont la perte d'activite serait la cause de la formation des tumeurs. II est 
important de rappeler que cette region est egalement sujette a "rempreinte 
matemelle" ; ('allele matemel est preferentiellement perdu dans les neuroblastomes 
presentant la deletion 1p36 (sans amplification de N-Myc) (Caron et a/.. Hum. Mol. 
Gen., 1995, 4, 535-539). Le gene sauvage SR-p70 introduit et exprime dans des 
cellules de neuroblastoma permet la reversion de leur transformation. La perte de ' 
cette activite anti-oncogenique est done associee au developpement de la tumeur. La i 
region 1p36 presente une homologie syngenique avec le segment distal du 
chromosome 4 de souris. Dans cette region a ete localise le gene curly tail (ct) (Beier 
et al., Mammalian Genome, 1995, 6, 269-272) implique dans les malformations 
congenitales du tube neural (MTN : spida bifida, anencephalie...). La souris ct est le 
meilleur modele animal d'etude de ces malformations. II est admis que ces 
malformations resultant d'anomalies de la proliferation cellulaire. Compte tenu de la 
nature du gene SR-p70 et de sa localisation chromosomique. une des hypotheses est ' 
que le SR-p70 pourrait dtre I'homologue humain de ct et qu'a ce litre, la detection des 
mutations precoces et les anomalies chromosomiques concemant ce gene devraient 
permettre par example comme application. Tidentification des personnes a risques 
(0,5-1 % des nouveaux-nes atteints par MTN). et la mise en oeuvre de traitements 
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preventifs (Neumann et a/.. Nature Genetics. 1994. 6, 357-362 : Di Vinci et a, Int j 
Cancer. 1994. 59, 422-426 ; Mo., era/.. PNAS, 1995. 92. 4407-4411 • Che ' e a/ 
Development. 1995. 121, 681-691). ' ' 



EXEMPLE XIV 

Etude allelique du gene SR-p70. 



Les alleles GC et AT sent identifies aisement par restriction Styl des products PGR de 
« exon 2 (voir exempie XI). On a done pu determiner ainsi. chez des individus 
heterozygotes GC/AT et porteurs de tumeurs neuroblastomes. (allele SR-p70 
perdu (GC ou AT) et cela malgre la presence de tissu contaminant sain 
O'une facon surprenante. .orsque la memo ana.yse est reaHsee sur I'ARN, un seu. 
allele est m,s en evidence independamment de presence ou non d'une deletion et 
Plus surprenant encore, malgre la presence de tissu sain. Cela suggere que 
empreinte (expression differentiel.es des deux alleles) existerait egalement dans le 
tissu contaminant. 

Pour .e verifier, on a repete la meme analyse sur de I'ARN provenant des ce.lu.es 
sanguines d'individus sains heterozygotes GC/AT. Un seul des deux types de transcrit 
a ete detecte egaiement dans ces ce.lu.es. Ce resu.,at confirme .'observation faite sur 

ZTZlZ7 aux quant * rexistence d ' una empreinte 9 * n6ti - ~ 

Les implications de cette decouverte sont importantes puisqu'eHe permet de postuter 
qu une seule mutation sporadique inactivant .'allele actlf SR.p70 entrafnera une perte 
d actlvite et cela potentiellement dans tous les tissus. 

L'absence de donnees precises sur la fonction biologique SR- P 70 ne permet pas de 
mesurer ,es consequences de cette perte d'activite SR- P 70 pour la cel.u.e 

ouTT' " h0mO, ° gie 8VeC ' a Pr ° t6ine - tumeur p53. ainsi 

r D ™oZZT ^ ' a SR ' P7 ° 6St U " faCteur d * *«"«■■*» capable d'utiliser 

lu7 , Z SU "* re U " rd '° ^ CStte Pr ° teine d3nS ,e cycle 

cellulaire et dans la differenciation. 

Knudson and Meadows 1980 (New Eng. J. Med. 302:1254-56) considered les 
ne urobla stomes IV-S comma une coHecton de cellu.es non malignes de ,a Ute 
neurale portant une mutation qui interfere avec leur differencation normale. 
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ll est concevable que la perte d'activite SR-p70 tout comme la perte du controle p53 
sur le cycle cellulaire favorise I'apparition d'anomalies cellulaires telles que 
I'aneuploTdie, ('amplification (decrites dans le cas des neuroblastomas) et d'autres 
remamements genetiques pouvant provoquer la transformation cellulaire (Livingstone 
et al. 1992. Cell 71 :923-25 ; Yin et al. 1992, Cell 72 :937-48 ; Cross et al 1995 
Science 267:1353-56; Fukasawa et al. 1996. science 271 :1744-47). Les 
neuroblastomes pourraient done provenir a leur origine d'une perte d'activite 
temporaire ou definitive de la SR-p70. favorisant ainsi I'apparition devenements 
oncogeniques et done la progression tumorale. 

Dans le cas de la deletion constitution elle 1 P 36 decrite par Biegel et al. 1993 (Am. J. 
Hum. Genet. 52 : 176-82), il y a bien apparition de neuroblastome IV-S, et le gene 
conceme est NBS-1 (SR-p70). 

En conclusion, ce qui est deem pour les neuroblastomes pourrait egalement 
s'appliquer a d'autres types de tumeurs notamment ceux associes a des 
remaniements de I'extremite du bras court du chromosome 1 (report 2 international 
workshop on human chr 1 mapping 1995, Cytogenetics and Cell Genet. 72 :113-154) 
Sur un plan therapeutique. ('implication de la SR-p70 dans I'apparition de tumeurs 
devrait conduire a eviter ('utilisation d'agents mutagenes en chimiotherapie. compte 
tenu des risques de transformation cellulaire par ces produits. et leur preferer des 
substances non mutagenes qui stimulent la differentiation. 

D'autre part, la frequence d'apparition des alleles GC et AT est la suivante • dans la 
population, Frequence(AT>0.l5 et sur un echantillon de 25 patients 
(neuroblastomes), F(AT)=0.30. Ces statistiques indiquent que ('allele AT pourrait etre 
un facteur de predisposition. 
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LISTE DE SEQUENCES 



(1) INFORMATION GENE RALE : 

(i) DEPOSANT: 

(A) NOM: sanofi 

<B) RUE: 32-34 rue Marbeuf 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75008 

(G> TELEPHONE: 01 53 77 40 00 
(H) TELECOPIE: 01 53 77 41 33 

fii) TITRE DE L f INVENTION: SR-p70 

(iii) NOMBRE DE SEQUENCES: 40 

(iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEMS D' EXPLOITATION: PC-DOS /MS- DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 



(2) INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERI STIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 2874 paires de bases 

(B) TYPE: acide nucleique 
<C) NOMBRE DE BR INS: double 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADW. 

(vi) ORIGINS: 

(A) ORGANISMS: Cebus apella 

<ix) CARACTERI STIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 156.. 2066 



<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

TGCCTCCCCG CCCGCGCACC CGCCCCGAGG CCTGTGCTCC TGCCAAGCGG ACGCAGCGAA 60 

GCCGGGGCCC GCGCCAGGCC GGCCGGGACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 120 

AGAGCGAGCT GCCCTCGGAG GCCGGTGTGA GGAAG ATG GCC CAG TCC ACC ACC 173 

Met Ala Gin Ser Thr Thr 
1 5 

ACC TCC CCC GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG 221 
Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu 
10 is 20 

GAA CCA GAC AGC ACC TAG TTC GAC CTT CCC CAG TCA AGC CGG GGG MT 2 69 

Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Ser Ser Arg Gly Asn 
25 30 35 

AAT GAG GTG GTG GGT GGC ACG GAT TCC AGC ATG GAC GTC TTC CAC CTA 317 
Asn Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu 
40 45 50 

GAG GGC ATG ACC ACA TCT GTC ATG GCC CAG TTC AAT TTG CTG AGC AGC 365 
Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser 
55 60 65 70 

Thr hIS rt G m TG ^ CGC GCT GCC TCC GCC AGC CCG TAG ACC 413 

Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr 

75 80 85 
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CCG GAG CAC GCC GCC AGC GTG CCC ACC CAT TCA CCC TAC GCA CAG CCC 461 
Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro 
90 95 100 

AGC TCC ACC TTC GAC ACC ATG TCG CCC GCG CCT GTC ATC CCC TCC AAC 509 
Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val lie Pro Ser Asn 

105 110 115 ^ 

ACC GAC TAT CCC GGA CCC CAC CAC TTC GAG GTC ACT TTC CAG CAG TCC 557 

Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser t 
120 125 130 

AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCA CTC TTG AAG AAA 605 
Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys 
135 140 145 150 

CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC 653 
Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro He Gin He Lys Val Ser 
155 160 165 

GCC CCA CCG CCC CCG GGC ACC GCC ATC CGG GCC ATG CCT GTC TAC AAG 701 

Ala Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val Tyr Lys / 
170 175 180 

AAG GCG GAG CAC GTG ACC GAC ATC GTG AAG CGC TGC CCC AAC CAC GAG 74 9 

Lys Ala Glu His Val Thr Asp He Val Lys Arg Cys Pro Asn His Glu 
185 190 195 

CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCC CCA GCC AGC CAC CTC 797 
Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser His Leu 
200 205 210 

ATC CGT GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAC GAC CCT GTC 84 5 

He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val 
215 220 225 230 

ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG 893 
Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly 

235 240 245 / 



I 



ACA GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC AGC TGT 941 
Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys 
250 255 260 

GTG GGG GGC ATG AAC CGA CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG 9B9 
Val Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr Leu Glu 
265 270 275 

ACG CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTC GAG GGC CGC ATC 1037 
Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg He 
280 285 290 

TGC GCC TGT CCT GGC CGC GAC CGA AAA GCC GAT GAG GAC CAC TAC CGG 1085 / 

Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arg 
295 300 305 310 

GAG CAG CAG GCC TTG AAT GAG AGC TCC GCC AAG AAC GGG GCT GCC AGC 1133 
Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser 
315 320 325 

AAG CGC GCC TTC AAG CAG AGT CCC CCT GCC GTC CCC GCC CTG GGC CCG 1181 
Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Pro 
330 335- 340 

GGT GTG AAG AAG CGG CGG CAC GGA GAC GAG GAC ACG TAC TAC CTG CAG 122 9 

Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin 
345 350 355 

GTG CGA GGC CGC GAG AAC TTC GAG ATC CTG ATG AAG CTG AAG GAG AGC 1277 

val Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys Leu Lys Glu Ser I 
360 365 370 1 



I 
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CTG GAG CTG ATG GAG TTG GTG CCG CAG CCG CTG GTA GAC TCC TAT CGG 
leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tyr Arg 
375 380 385 390 



CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC CCA TCC 
Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser 
395 400 405 

TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC GTG AAC 
Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Val Asn 
410 41S 420 

AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGC 
Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Ser 
425 430 435 

TCG GCA GCT ACA CCC AAC CTG GGA CCT GTG GGC TCT GGG ATG CTC AAC 
Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Ser Gly Met Leu Asn 
440 445 450 

AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC CAC 
Asn His Gly His Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser His 
455 460 465 470 

GGC ACC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC 
Gly Thr Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro 
475 480 485 

TAC CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG GGG TCT 
Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys 
490 495 500 

CCA AAC TGC ATC GAG TAT TTC ACG TCC CAG GGG TTA CAG AGC ATT TAC 
Pro Asn Cys lie Glu Tyr Phe Thr Ser Gin Gly Leu Gin ser He Tyr 
505 510 515 

CAC CTG CAG AAC CTG ACC ATC GAG GAC CTG GGG GCC CTG AAG ATC CCC 
His Leu Gin Asn Leu Thr He Glu Asp Leu Gly Ala Leu Lys He Pro 
520 525 530 



GAG CAG TAT CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG AAG CAG 
Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin Asp Leu Lys Gin 
535 540 545 S50 

GGC CAC GAC TAC GGC GCC GCC GCG CAG CAG CTG CTC CGC TCC AGC AAC 
Gly His Asp Tyr Gly Ala Ala Ala Gin Gin Leu Leu Arg Ser Ser Asn 
555 560 565 

GCG GCC GCC ATT TCC ATC GGC GGC TCC GGG GAG CTG CAG CGC CAG CGG 
Ala Ala Ala He Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin Arg 
570 575 580 

GTC ATG GAG GCC GTG CAC TTC CGC GTG CGC CAC ACC ATC ACC ATC CCC 
Val Met Glu Ala Val His Phe Arg Val Arg His Thr He Thr He Pro 
585 590 595 

AAC CGC GGC GGC CCC GGC GCC GGC CCC GAC GAG TGG GCG GAC TTC GGC 

A * n ^? Gly Gly Pro G1 * Ala G1 y Pro Glu Trp Ala Asp Phe Gly 
6 °0 605 610 

TTC GAC CTG CCC GAC TGC AAG GCC CGC AAG CAG CCC ATC AAG GAG GAG 
Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He Lys Glu Glu 
615 620 625 630 

TTC ACG GAG GCC GAG ATC CAC TGAGGGGCCG GGCCCAGCCA GAGCCTGTGC 
Phe Thr Glu Ala Glu He His 
635 

CACCGCCCAG AGAC CCAGGC CGCCTCGCTC TCCTTCCTGT GTCCAAAACT GCCTCCGGAG 
GCAGGGCCTC CAGGCTGTGC CCGGGGAAAG GCAAGGTCCG GCCCATGCCC CGGCACCTCA 



132S 

1373 

1421 

1469 

1517 

1565 

1613 

1661 

1709 

17S7 

1805 

1853 

1901 

1949 

1997 

2045 

2096 

2156 
2216 
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CCGGCCCCAG GAGAGGCCCA GCCACCAAAG CCGCCTGCGG ACAGCCTGAG TCACCTGCAG 2276 

AACCTTCTGG AGCTGCCCTA ATGCTGGGCT TGCGGGGCAG GGGCCGGCCC ACTCTCAGCC 233 6 

CTGCCACTGC CGGGCGTGCT CCATGGCAGG CGTGGGTGGG GACCGCAGTG TCAGCTCCGA 2396 

CCTCCAGGCC TCATCCTAGA GACTCTGTCA TCTGCCGATC AAGCAAGGTC CTTCCAGAGG 2456 

AAAGAATCCT CTTCGCTGGT GGACTGCCAA AAAGTATTTT GCGACATCTT TTGGTTCTGG 2516 

AGAGTGGTGA GCAGCCAAGC GACTGTGTCT GAAACACCGT GCATTTTCAG GGAATGTCCC 2 576 

TAACGGGCTG GGGACTCTCT CTGCTGGACT TGGGAGTGGC CTTTGCCCCC AGCACACTGT 2 636 

ATTCTGCGGG ACCGCCTCCT TCCTGCCCCT AACAACCACC AAAGTGTTGC TGAAATTGGA 2 696 

GAAAACTGGG GAAGGCGCAA CCCCTCCCAG GTGCGGGAAG CATCTGGTAC CGCCTCGGCC 2756 

AGTGCCCCTC AGCC TGGCCA CAGTCACCTC TCCTTGGGGA ACCCTGGGCA GAAAGGGACA 2816 

GCCTGTCCTT AGAGGACCGG AAATTGTCAA TATTTGATAA AATGATACCC TTTTCTAC 2874 

(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTER I STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 637 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proline 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

Met Ala Gin Ser Thr Thr Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
1 5 10 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 4S 

Met Asp Val Phe Hia Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Aap Gin Met Ser Ser Arg Ala Ala 
65 70 75 eo 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Aap Thr Met Ser Pro Ala 
100 105 no 

Pro val He Pro Ser Asn Thr Asp Tyr Pro Gly Pro Hia Hia Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tvr 
130 135 140 * 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lya Thr Cya Pro 
145 ISO 155 160 

He Gin He Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp lie Val Lvs 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
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195 200 m 205 

Ala Pro Ala Ser His Leu He Arg val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Ser Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Ser 
450 45S 460 

Glu Met Thr Ser Ser His Gly Thr Gin Ser Met Val Ser Gly Ser His 
465 470 475 4B0 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
485 490 495 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin 
500 505 510 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
515 520 525 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly 
530 535 540 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Gly Ala Ala Ala Gin Gin 
545 550 555 560 

Leu Leu Arg Ser Ser Asn Ala Ala Ala He Ser He Gly Gly Ser Gly 
565 570 575 

Glu Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Axg Val Arg 
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580 



585 



5 90 



His Thr lie Thr lie Pro Asn Arg Gly Gly Pro Gly Ala Gly Pro Asp 
595 600 60S 



Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys 

610 615 620 

Gin Pro lie Lys Glu Glu Phe Thr Glu Ala Glu lie His 
625 630 635 



(2) INFORMATION POUR LA SEQ ID NO: 3: 



(i) CARACTERISTIQUES DC LA SEQUENCE: 

(A) LONGUEUR: 2034 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc 



<vi) ORIGINE: 

(A) ORGAN IS ME : Cebus apella 

{ix> CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 156.. 1652 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 



TGCCTCCCCG CCCGCGCACC CGCCCCGAGG CCTGTGCTCC TGCGAAGGGG ACGCAGCGAA 60 

GCCGGGGCCC GCGCCAGGCC GGCCGGGACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 120 

AGAGCGAGCT GCCCTCGGAG GCCGGTGTGA GGAAG ATG GCC CAG TCC ACC ACC 173 

Met Ala Gin Ser Thr Thr 
1 5 

ACC TCC CCC GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG 221 
Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu 
10 15 20 

GAA CCA GAC AGC ACC TAC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT 2 69 

Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin ser Ser Arg Gly Asn 
25 30 35 

AAT GAG GTG GTG GGT GGC ACG GAT TCC AGC ATG GAC GTC TTC CAC CTA 317 
Asn Glu Val Val Gly Gly Thr Asp ser Ser Met Asp Val Phe His Leu 
40 45 5 0 

GAG GGC ATG ACC ACA TCT GTC ATG GCC CAG TTC AAT TTG CTG AGC AGC 365 
Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser 
55 60 65 70 

ACC ATG GAC CAG ATG AGC AGC CGC GCT GCC TCG GCC AGC CCG TAC ACC 4 13 

Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr 
75 80 65 

CCG GAG CAC GCC GCC AGC GTG CCC ACC CAT TCA CCC TAC GCA CAG CCC 4 61 

Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro 
90 95 ioo 

AGC TCC ACC TTC GAC ACC ATG TCG CCC GCG CCT GTC ATC CCC TCC AAC 509 
Ser ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val He Pro Ser Asn 
105 no us 

ACC GAC TAT CCC GGA CCC CAC CAC TTC GAG GTC ACT TTC CAG CAG TCC 557 
Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser 
120 125 130 



AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCA CTC TTG AAG AAA 



605 
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Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pre Leu Leu Lys Lys 
135 140 " 145 150 

CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC 653 
Leu Tyr Cys Gin He Ala Lys Thr Cys Pro lie Gin He Lys Val Ser 
155 160 165 

GCC CCA CCG CCC CCG GGC ACC GCC ATC CGG GCC ATG CCT GTC TAC AAG 701 
Ala Pro Pro Pro Pro Gly Thr Ala lie Arg Ala Met Pro Val Tyr Lys 
170 175 180 

AAG GCG GAG CAC GTG ACC GAC ATC GTG AAG CGC TGC CCC AAC CAC GAG 74 9 

Lys Ala Glu His Val Thr Asp He Val Lys Arg Cys Pro Asn His Glu 
185 190 195 

CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCC CCA GCC AGC CAC CTC 797 
Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser His Leu 
200 205 210 

ATC CGT GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAC GAC CCT GTC 845 
He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val 
215 220 225 230 

ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG 693 
Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly 
235 240 . 245 

ACA GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC AGC TGT 941 
Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys 
250 25S 260 

GTG GGG GGC ATG AAC CGA CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG 98 9 

Val Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr Leu Glu 
265 270 275 

ACG CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTC GAG GGC CGC ATC 1037 
Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg He 
280 285 290 

TGC GCC TGT CCT GGC CGC GAC CGA AAA GCC GAT GAG GAC CAC TAC CGG 1085 
Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arg 
295 300 305 310 

GAG CAG CAG GCC TTG AAT GAG AGC TCC GCC AAG AAC GGG GCT GCC AGC 1133 
Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser 
315 320 325 

AAG CGC GCC TTC AAG CAG AGT CCC CCT GCC GTC CCC GCC CTG GGC CCG 1181 
Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Pro 
330 335 340 

GGT GTG AAG AAG CGG CGG CAC GGA GAC GAG GAC ACG TAC TAC CTG CAG 1229 
Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin 
345 350 355 

GTG CGA GGC CGC GAG AAC TTC GAG ATC CTG ATG AAG CTG AAG GAG AGC 1277 
Val Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys Leu Lys Glu Ser 
360 365 370 

CTG GAG CTG ATG GAG TTG GTG CCG CAG CCG CTG GTA GAC TCC TAT CGG 1325 
Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tyr Arg 
375 380 385 390 

CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC CCA TCC 137 3 

Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser 
395 400 405 

TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC GTG AAC 1421 
Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Val Asn 
410 415 420 

AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGC 14 69 
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Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Ser 
425 430 . 435 

TCG GCA GCT AC A CCC AAC CTG GGA CCT GTG GGC TCT GGG ATG CTC AAC 1517 
Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Ser Gly Met Leu Asn 
440 445 450 



AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC CAC 1565 

Asn His Gly His Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser His I 
455 460 465 470 ' 

GGC ACC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC 1613 1 

Gly Thr Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro 
475 480 485 

TAC CAC GCC GAC CCC AGC CTC GTC AGG ACC TGG GGG CCC TGAAGATCCC 1662 
Tyr His Ala Asp Pro Ser Leu Val Arg Thr Trp Gly Pro 
490 495 

CGAGCAGTAT CGCATGACCA TCTGGCGGGG CCTGCAGGAC CTGAAGCAGG GCC AC GACTA 1722 

CGGCGCCGCC GC GC AGC AGC TGCTCCGCTC C AGC AAC GC G GCCGCCATTT CCATCGGCGG 1782 

CTCCGGGGAG CTGCAGCGCC AGCGGGTCAT GGAGGCCGTG CACTTCCGCG TGCGCCACAC 1842 ' 

CATCACCATC CCCAACCGCG GCGGCCCCGG CGCCGGCCCC GAC GAGTGGG CGGACTTCGG 1902 

CTTCGACCTG CCCGACTGCA AGGCCCGCAA GCAGCCCATC AAGGAGGAGT TCACGGAGGC 1962 

CGAGAT C CAC TGAGGGGCCG GGCCCAGCCA GAGC CTGTGC CACCGCCCAG AGACCCAGGC 2022 

CGCCTCGCTC TC 2Q34 

(2) INFORMATION POUR IA SEQ ID NO: 4: 

(i) CARACTERI 5TIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 499 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 4: 

Met Ala Gin Ser Thr Thr Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
15 10 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 70 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 no 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
AJO 135 140 - 
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Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 
145 ISO 155 160 

lie Gin He Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp He Val Lys 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro ser 
395 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Ser Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Ser 
450 455 460 

Glu Met Thr ser Ser His Gly Thr Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Arg Thr 
485 490 495 

Trp Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 5: 



i 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 215 6 paire3 de bases 

(B) TYPE: acide nuclei que 

(C) NOMBRE DE BRIN5 : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNC 

(vi) ORIGINE: 

(A) ORGANISMS: Homo sapiens 

<ix> CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 33.. 1940 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 



GCGAGCTGCC CTCGGAGGCC GGCGTGGGGA AG ATG GCC CAG TCC ACC GCC ACC 53 

Met Ala Gin Ser Thr Ala Thr 
1 5 



TCC CCT GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG GAA 
Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu Glu 
10 15 20 



101 



CCA GAC AGC ACC TAC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT AAT 149 
Pro Asp ser Thr Tyr Phe Asp Leu Pro Gin Ser Ser Arg Gly Asn Asn 
25 30 35 

GAG GTG GTG GGC GGA ACG GAT TCC AGC ATG GAC GTC TTC CAC CTG GAG 197 
Glu Val Val Gly Gly Thr Asp Ser ser Met Asp Val Phe His Leu Glu 
40 45 50 55 

GGC ATG ACT ACA TCT GTC ATG GCC CAG TTC AAT CTG CTG AGC AGC ACC 245 
Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser Thr 
60 65 70 

ATG GAC CAG ATG AGC AGC CGC GCG GCC TCG GCC AGC CCC TAC ACC CCA 293 
Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr Pro 
75 80 85 

GAG CAC GCC GCC AGC GTG CCC ACC CAC TCG CCC TAC GCA CAA CCC AGC 341 
Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro Ser 
90 95 100 

TCC ACC TTC GAC ACC ATG TCG CCG GCG CCT GTC ATC CCC TCC AAC ACC 389 
Ser Thr Phe Asp Thr Met ser Pro Ala Pro Val lie Pro Ser Asn Thr 
10S no us 

GAC TAC CCC GGA CCC CAC CAC TTT GAG GTC ACT TTC CAG CAG TCC AGC 437 
Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser Ser 
120 125 130 135 

ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCG CTC TTG AAG AAA CTC 4 85 

Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys Leu 
140 145 150 

TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC ACC 533 
Tyr Cys Gin He Ala Lys Thr Cys Pro He Gin He Lys Val Ser Thr 
15S 160 165 

CCG CCA CCC CCA GGC ACT GCC ATC CGG GCC ATG CCT GTT TAC AAG AAA 581 
Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val Tyr Lys Lys 
170 175 180 

GCG GAG CAC GTG ACC GAC GTC GTG AAA CGC TGC CCC AAC CAC GAG CTC 629 
Ala Glu His Val Thr Asp Val Val Lys Arg Cys Pro Asn His Glu Leu 
185 190 195 

GGG AGG GAC TTC AAC GAA GGA CAG TCT GCT CCA GCC AGC CAC CTC ATC 677 
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Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser His Leu lie 
200 205 210 215 

CGC GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAT GAC CCT GTC ACC 725 
Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val Thr 
220 225 230 

GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG ACG 773 
Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly Thr 
235 240 245 

GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC AGC TGT GTA 821 
Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys Val 
2S0 255 260 

GGG GGC ATG AAC CGG CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG ATG 8 69 

Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr Leu Glu Met 
265 270 275 

CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTT GAG GGC CGC ATC TGC 917 
Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg He Cys 
280 285 290 295 

GCC TGT CCT GGC CGC GAC CGA AAA GCT GAT GAG GAC CAC TAC CGG GAG 965 
Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arg Glu 
300 305 310 

CAG CAG GCC CTG AAC GAG AGC TCC GCC AAG AAC GGG GCC GCC AGC AAG 1013 
Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser Lys 
315 320 325 

CGT GCC TTC AAG CAG AGC CCC CCT GCC GTC CCC GCC CTT GGT GCC GGT 1061 
Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly 
330 335 340 

GTG AAG AAG CGG CGG CAT GGA GAC GAG GAC ACG TAC TAC CTT CAG GTG 1109 
val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin Val 
345 350 * 355 

CGA GGC CGG GAG AAC TTT GAG ATC CTG ATG AAG CTG AAA GAG AGC CTG 1157 
Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys Leu Lys Glu ser Leu 
360 365 370 375 

GAG CTG ATG GAG TTG GTG CCG CAG CCA CTG GTG GAC TCC TAT CGG CAG 1205 
Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tyr Arg Gin 
380 385 390 

CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC CCG TCC TAC 1253 
Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser Tyr 
395 400 405 

GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC ATG AAC AAG 1301 
Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Met Asn Lys 
410 415 420 

CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGT TCG 1349 
Leu Pro ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Ser Ser 
425 430 435 

GCA GCT ACA CCC AAC CTG GGG CCC GTG GGC CCC GGG ATG CTC AAC AAC 1397 
Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Pro Gly Met Leu Asn Asn 
440 445 450 455 

CAT GGC CAC GCA GTG CCA GCC AAC GGC GAG ATG AGC AGC AGC CAC AGC 1445 
His Gly His Ala Val Pro Ala Asn Gly Glu Met Ser Ser Ser His Ser 
460 465 470 

GCC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC TAC 14 93 

Ala Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro Tyr 
475 480 485 

CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG GGG TGT CCA 15 41 
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His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys Pro 
490 495 * 500 

AAC TGC ATC GAG TAT TTC ACC TCC CAA GGG TTA CAG AGC ATT TAC CAC 15 89 

Asn Cys He Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser He Tyr His 
505 510 515 

CTG CAG AAC CTG ACC ATT GAG GAC CTG GGG GCC CTG AAG ATC CCC GAG 1637 

Leu Gin Asn Leu Thr He Glu Asp Leu Gly Ala Leu Lys He Pro Glu / 
520 525 530 535 

CAG TAC CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG AAG CAG GGC 1685 
Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin Asp Leu Lys Gin Gly 
540 545 550 

CAC GAC TAC AGC ACC GCG CAG CAG CTG CTC CGC TCT AGC AAC GCG GCC 1733 
His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg Ser Ser Asn Ala Ala 
555 560 565 

ACC ATC TCC ATC GGC GGC TCA GGG GAA CTG CAG CGC CAG CGG GTC ATG 1781 
Thr He ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin Arg Val Met 
570 575 580 

GAG GCC GTG CAC TTC CGC GTG CGC CAC ACC ATC ACC ATC CCC AAC CGC 1829 
Glu Ala Val His Phe Arg Val Arg His Thr He Thr He Pro Asn Arg 

585 590 595 j 

GGC GGC CCA GGC GGC GGC CCT GAC GAG TGG GCG GAC TTC GGC TTC GAC 1B77 

Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe Gly Phe Asp I 
600 605 610 615 

CTG CCC GAC TGC AAG GCC CGC AAG CAG CCC ATC AAG GAG GAG TTC ACG 1925 
Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He Lys Glu Glu Phe Thr 
620 625 630 

GAG GCC GAG ATC CAC TGAGGGCCTC GCCTGGCTGC AGCCTGCGCC ACCGCCCAGA 1980 
Glu Ala Glu He His 
635 

GACCCAAGCT GCCTCCCCTC TCCTTCCTGT GTGTCCAAAA CTGCCTCAGG AGGC AGGAC C 2040 ; 

TTCGGGCTGT GCCCGGGGAA AGGCAAGGTC CGGCCCATCC CCAGGCACCT CACAGGCCCC 2100 

AGGAAAGGCC CAGCCACCGA AGCCGCCTGT GGACAGC CTG AGTCACCTGC AG AAC C 215 6 

(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 636 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine . 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

Met Ala Gin Ser Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu f 
15 10 15 

I 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 

65 70 75 * 80 
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Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
65 * 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 110 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
130 135 140 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lya Thr Cys Pro 
145 150 155 1€0 

lie Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Ash Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

lie He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
3S5 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 360 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lya 
405 410 415 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
4S0 455 460 
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Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
485 490 495 

Leu Thr Gly Leu Gly Cys Pro Asn Cys lie Glu Tyr Phe Thr Ser Gin 
500 505 510 

Gly Leu Gin Ser lie Tyr His Leu Gin Asn Leu Thr lie Glu Asp Leu 
515 520 525 

Gly Ala Leu Lys lie Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly 
530 535 540 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu 
545 550 555 560 

Leu Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
565 570 575 

Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
580 585 590 

Thr He Thr- He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu 
595 600 605 

Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin 
610 615 620 

Pro He Lys Glu Glu Phe Thr Glu Ala Glu He His 
625 630 635 

(2) INFORMATION POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2040 paires de bases 

(B) TYPE : acide nuclei que 

(C) NOMBRE DE BRINS : double 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi> ORIGINS: 

(A) ORGANISMS: Mus mua cuius 

(ix) CARACTERISTIQUB ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 124.. 1690 



<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

TGATCTCCCT GTGGCCTGCA GGGGACTGAG CCAGGGAGTA GATGCCCTGA GACCCCAAGG 60 

GACACCCAAG GAAACCTTGC TGGCTTTGAG AAAGGGATCG TCTCTCTCCT GCCCAAGAGA 120 

AGC ATG TGT ATG GGC CCT GTG TAT GAA TCC TTG GGG CAG GCC CAG TTC 168 
Met Cys Met Gly Pro Val Tyr Glu Ser Leu Gly Gin Ala Gin Phe 
1 5 10 15 

AAT TTG CTC AGC AGT GCC ATG GAC CAG ATG GGC AGC CGT GCG GCC CCG 216 
Asn Leu Leu Ser Ser Ala Met Asp Gin Met Gly Ser Axg Ala Ala Pro 
20 25 30 

GCG AGC CCC TAC ACC CCG GAG CAC GCC GCC AGC GCG CCC ACC CAC TCG 2 64 

Ala Ser Pro Tyr Thr Pro Glu Hia Ala Ala Ser Ala Pro Thr His Ser 
35 40 45 

CCC TAC GCG CAG CCC AGC TCC ACC TTC GAC ACC ATG TCT CCG GCG CCT 312 
Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
50 55 60 



T 



(C) 2000 Copyright Derwent Information Ltd. 



WO 97/28186 



56 



PCT/FR97/00214 



GTC ATC CCT TCC AAT ACC GAC TAC CCC GGC CCC CAC CAC TTC GAG GTC 3 60 

Val lie Pro Sex Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val 
65 70 75 

ACC TTC CAG CAG TCG AGC ACT GCC AAG TCG GCC ACC TGG ACA TAC TCC 409 
Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser 
80 85 90 95 

CCA CTC TTG AAG AAG TTG TAC TGT CAG ATT GCT AAG ACA TGC CCC ATC 45 6 

Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro lie 
100 105 110 

CAG ATC AAA GTG TCC ACA CCA CCA CCC CCG GGC ACG GCC ATC CGG GCC 504. 
Gin lie Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala lie Arg Ala 
115 120 125 

ATG CCT GTC TAC AAG AAG GCA GAG CAT GTG ACC GAC ATT GTT AAG CGC 552 
Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp lie Val Lys Arg 
130 135 140 

TGC CCC AAC CAC GAG CTT GGA AGG GAC TTC AAT GAA GGA CAG TCT GCC 600 
Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala 
145 150 155 

CCG GCT AGC CAC CTC ATC CGT GTA GAA GGC AAC AAC CTC GCC CAG TAC 64 8 

Pro Ala Ser His Leu lie Arg Val Glu Gly Asn Asn Leu Ala Gin Tyr 
160 165 170 175 

GTG GAT GAC CCT GTC ACC GGA AGG CAG AGT GTG GTT GTG CCG TAT GAA 696 
Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 
180 185 190 

CCC CCA CAG GTG GGA ACA GAA TTT ACC ACC ATC CTG TAC AAC TTC ATG 74 4 

Pro Pro Gin Val Gly Thr Glu Phe Thr Thr lie Leu Tyr Asn Phe Met 
195 200 205 

TGT AAC AGC AGC TGT GTG GGG GGC ATG AAT CGG AGG CCC ATC CTT GTC 792 
Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu Val 
210 215 220 

ATC ATC ACC CTG GAG ACC CGG GAT GGA CAG GTC CTG GGC CGC CGG TCT 840 
He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 

TTC GAG GGT CGC ATC TGT GCC TGT CCT GGC CGT GAC CGC AAA GCT GAT 688 
Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp 
240 245 250 25S 

GAA GAC CAT TAC CGG GAG CAA CAG GCT CTG AAT GAA AGT ACC ACC AAA 936 
Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Thr Thr Lys 
260 265 270 

AAT GGA GCT GCC AGC AAA CGT GCA TTC AAG CAG AGC CCC CCT GCC ATC 984 
Asn Gly Ala Ala Ser Lys Axg Ala Phe Lys Gin Ser Pro Pro Ala He 
275 280 2B5 

CCT GCC CTG GGT ACC AAC GTG AAG AAG AGA CGC CAC GGG GAC GAG GAC 1032 
Pro Ala Leu Gly Thr Asn Val Lys Lys Arg Arg His Gly Asp Glu Asp 
290 295 300 

ATG TTC TAC ATG CAC GTG CGA GGC CGG GAG AAC TTT GAG ATC TTG ATG 1080 
Met Phe Tyr Met His Val Arg Gly Arg Glu Asn Phe Glu He Leu Met 
305 310 315 

AAA GTC AAG GAG AGC CTA GAA CTG ATG GAG CTT GTG CCC CAG CCT TTG 112 8 

Lys Val Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
320 325 330 335 

GTT GAC TCC TAT CGA CAG CAG CAG CAG CAG CAG CTC CTA CAG AGG CCG 1176 
Val Asp ser Tyr Arg Gin Gin Gin Gin Gin Gin Leu Leu Gin Arg Pro 
340 345 350 
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AGT CAC CTG CAG CCT CCA TCC TAT GGG CCC GTG CTC TCC CCA ATG AAC 122 4 

Ser His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn 
355 360 365 

AAG GTA CAC GGT GGT GTC AAC AAA CTG CCC TCC GTC AAC CAG CTG GTG 1272 
Lys Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val 
370 375 360 

GGC CAG CCT CCC CCG CAC AGC TCA GCA GCT GGG CCC AAC CTG GGG CCC 1320 
Gly Gin Pro Pro Pro Hi3 Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro 
385 390 395 

ATG GGC TCC GGG ATG CTC AAC AGC CAC GGC CAC AGC ATG CCG GCC AAT 13 68 

Met Gly Ser Gly Met Leu Asn Ser His Gly His Ser Met Pro Ala Asn 
400 405 410 415 

GGT GAG ATG AAT GGA GGC CAC AGC TCC CAG ACC ATG GTT TCG GGA TCC 1416 
Gly Glu Met Asn Gly Gly His Ser Ser Gin Thr Met Val Ser Gly Ser 
420 425 430 

CAC TGC ACC CCG CCA CCC CCC TAT CAT GCA GAC CCC AGC CTC GTC AGT 14 64 

His Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser 
435 440 445 

TTT TTG ACA GGG TTG GGG TGT CCA AAC TGC ATC GAG TGC TTC ACT TCC 1512 
Phe Leu Thr Gly Leu Gly Cys Pro Asn Cys lie Glu Cys Phe Thr Ser 
450 455 460 

CAA GGG TTG CAG AGC ATC TAG CAC CTG CAG AAC CTT ACC ATC GAG GAC 1560 
Gin Gly Leu Gin Ser lie Tyr His Leu Gin Asn Leu Thr He Glu Asp 
465 470 475 

CTT GGG GCT CTG AAG GTC CCT GAC CAG TAC CGT ATG ACC ATC TGG AGG 1608 
Leu Gly Ala Leu Lys Val Pro Asp Gin Tyr Arg Met Thr He Trp Arg 
4B0 485 490 495 

GGC CTA CAG GAC CTG AAG CAG AGC CAT GAC TGC GGC CAG CAA CTG CTA 165 6 

Gly Leu Gin Asp Leu Lys Gin Ser His Asp Cys Gly Gin Gin Leu Leu 
500 505 510 

CGC TCC AGC AGC AAC GCG GCC ACC ATC TCC ATC GGC GGC TCT GGC GAG 1704 
Arg Ser Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
515 520 525 

CTG CAG CGG CAG CGG GTC ATG GAA GCC GTG CAT TTC CGT GTG CGC CAC 1752 
Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
530 535 540 

ACC ATC ACA ATC CCC AAC CGT GGA GGC GCA GGT GCG GTG ACA GGT CCC 1800 
Thr He Thr He Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro 
545 550 555 

GAC GAG TGG GCG GAC TTT GGC TTT GAC CTG CCT GAC TGC AAG TCC CGT 1848 
Asp Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ser Arg 
560 565 570 575 

AAG CAG CCC ATC AAA GAG GAG TTC ACA GAG ACA GAG AGC CAC 1690 
Lys Gin Pro He Lys Glu Glu Phe Thr Glu Thr Glu Ser His 
S80 585 

TGAGGAACGT ACCTTCTTCT CCTGTCCTTC CTCTGTGAGA AACTGCTCTT GGAAGTGGGA 1950 

CCTGTTGGCT GTGCCCACAG AAACCAGCAA GGACCTTCTG CCGGATGCCA TTCCTGAAGG 2010 

GAAGTCGCTC ATGAACTAAC TCCCTCTTGG 2040 



(2) INFORMATION POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 589 acidea amines 
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(3) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Met Cys Met Gly Pro Val Tyr Glu Ser Leu Gly Gin Ala Gin Phe Asn 
15 10 15 

Leu Leu Ser Ser Ala Met Asp Gin Met Gly Ser Arg Ala Ala Pro Ala 
20 25 30 

Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser Pro 
35 40 45 

Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val 
50 55 60 

He Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr 
65 70 75 80 

Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro 
85 90 95 

Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro He Gin 
100 105 110 

He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met 
115 120 125 

Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp He Val Lys Arg cys 
130 135 140 

Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro 
145 150 155 160 

Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ala Gin Tyr Val 
165 170 175 

Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro 
180 185 . 190 

Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys 
195 200 205 

Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu Val He 
210 215 220 

He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe 
225 230 235 240 

Glu Gly Arg He cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu 
245 250 255 

Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Thr Thr Lys Asn 
260 265 270 

Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala He Pro 
275 280 28S 

Ala Leu Gly Thr Asn Val Lys Lys Arg Arg His Gly Asp Glu Asp Met 
290 295 300 

Phe Tyr Met His Val Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys 
305 310 315 320 

Val Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val 
325 330 335 

Asp Ser Tyr Arg Gin Gin Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
340 345 350 
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His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
355 360 365 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
370 375 380 

Gin Pro Pro Pro His Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro Met 
385 390 395 400 

Gly Ser Gly Met Leu Asn Ser His Gly His Ser Met Pro Ala Asn Gly 
405 410 415 

Glu Met Asn Gly Gly His Ser Ser Gin Thr Met Val Ser Gly Ser His 
420 425 430 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
435 440 445 

Leu Thr Gly Leu Gly Cys Pro Asn Cys lie Glu Cys Phe Thr Ser Gin 
450 455 460 

Gly Leu Gin Ser lie Tyr His Leu Gin Asn Leu Thr lie Glu Asp Leu 
465 470 475 480 

Gly Ala Leu Lys Val Pro Asp Gin Tyr Arg Met Thr He Trp Arg Gly 
485 490 495 

Leu Gin Asp Leu Lys Gin Ser His Asp Cys Gly Gin Gin Leu Leu Arg 
500 505 510 

Ser Ser Ser Asn Ala Ala Thr lie Ser He Gly Gly Ser Gly Glu Leu 
SIS 520 525 

Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr 
530 S35 540 

He Thr He Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro Asp 
545 5S0 555 560 

Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ser Arg Lys 
565 570 575 

Gin Pro He Lys Glu Glu Phe Thr Glu Thr Glu Ser His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 7S8 paires de bases 

(B) TYPE: acide nuclei que 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: line*ire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGAN IS ME: Mus musculus 

(ix) CARACTERISTIQUE ADDITIONELLE : 
<A) NOM/CLE: CDS 

(B) EMPLACEMENT: 389. .757 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

TGGTCCCGCT TCGACCAAGA CTCCGGCTAC CAGCTTGCGG GCCCCGCGGA GGAGGAGACC 60 

CCGCTGGGGC TAGCTGGGCG ACGCGCGCCA AGCCGCGGCG GGAAGGAGGC GGGAGGAGCG 120 

GGGCCCGAGA CCCCGACTCG GGCAGAGCCA GCTGGGGAGG CGGGGCGCGC GTGGGAGCCA 180 



(C) 2000 Copyright Derwent Information Ltd 



WO 97/28186 



60 



PCT/FR97/00214 



GGGGCCCGGG TGGCCGGCCC TCCTCCGCCA CGGCTGAGTG CCCGCGCTGC CTTCCCGCCG 2 40 

GTCCGCCAAG AAAGGCGCTA AGCCTGCGGC AGTCCCCTCG CCGCCGCCTC CCTGCTCCGC 3 00 

ACCCTTATAA CCCGCCGTCC CGCATCCAGG CGAGGAGGCA ACGCTGCAGC CCAGCCCTCG 3 60 

CCGACGCCGA CGCCCGGCCC GGAGCAGA ATG AGC GGC AGC GTT GGG GAG ATG 412 

Met Ser Gly Ser Val Gly Glu Met 
1 5 

GCC CAG ACC TCT TCT TCC TCC TCC TCC ACC TTC GAG CAC CTG TGG AGT 4 60 

Ala Gin Thr Ser Ser Ser Ser Ser Ser Thr Phe Glu His Leu Trp Ser 
10 15 20 

TCT CTA GAG CCA GAC AGC ACC TAC TTT GAC CTC CCC CAG CCC AGC CAA 508 
Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Pro Ser Gin 
25 30 35 40 

GGG ACT AGC GAG GCA TCA GGC AGC GAG GAG TCC AAC ATG GAT GTC TTC 55 6 

Gly Thr Ser Glu Ala Ser Gly Ser Glu Glu Ser Asn Met Asp Val Phe 
45 50 55 

CAC CTG CAA GGC ATG GCC CAG TTC AAT TTG CTC AGC AGT GCC ATG GAC 604 
His Leu Gin Gly Met Ala Gin Phe Asn Leu Leu Ser Ser Ala Met Asp 
60 65 70 

CAG ATG GGC AGC CGT GCG GCC CCG GCG AGC CCC TAC ACC CCG GAG CAC 652 
Gin Met Gly Ser Arg Ala Ala Pro Ala Ser Pro Tyr Thr Pro Glu His 
75 B0 85 

GCC GCC AGC GCG CCC ACC CAC TCG CCC TAC GCG CAG CCC AGC TCC ACC 700 
Ala Ala Ser Ala Pro Thr His Ser Pro Tyr Ala Gin Pro Ser Ser Thr 
90 95 100 

TTC GAC ACC ATG TCT CCG GCG CCT GTC ATC CCT TCC AAT ACC GAC TAC 748 
Phe Asp Thr Met Ser Pro Ala Pro Val He Pro Ser Asn Thr Asp Tyr 
105 110 115 120 

CCC GGC CCC C 75B 
Pro Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 123 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Ser Gly Ser Val Gly Glu Met Ala Gin Thr Ser Ser Ser Ser Ser 
15 10 15 

Ser Thr Phe Glu His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr 
20 25 30 

Phe Asp Leu Pro Gin Pro Ser Gin Gly Thr Ser Glu Ala Ser Gly Ser 
35 40 45 

Glu Glu Ser Asn Met Asp Val Phe His Leu Gin Gly Met Ala Gin Phe 
SO 5S 60 

Asn Leu Leu Ser ser Ala Met Asp Gin Met Gly Ser Arg Ala Ala Pro 
65 70 75 80 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser 
85 90 95 
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Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
100 103 110 

Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro 
115 120 

(2) INFORMATION POUR LA SEQ ID NO: 11: 

(i) CARACTERI ST I QUE5 DE LA SEQUENCE: 

(A) LONGUEUR: 559 paires de bases 

(B) TYPE: acide nuclei que 

(C) N 0MB RE DE BR INS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE : 

(A) ORGAN I 5ME : Homo sapiens 

(xi> DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

CGACCTTCCC CAGTCAAGCC GGGGGAATAA TGAGGTGGTG GGCGGAACGG ATTCCAGCAT 60 

GGACGTCTTC C AC CTGGAGG GC ATGAC T AC ATCTGTCATG CATCCTCGGC TCCTGCCTCA 120 

CTAGCTGCGG AGCCTCTCCC GCTCGGTCCA CGCTGCCGGG CGGCCACGAC CGTGACCCTT 180 

CCCCTCGGGC CGCCCAGATC CATGCCTCGT CCCACGGGAC ACCAGTTCCC TGGCGTGTGC 240 

AGACCCCCCG GCGCCTACCA TGCTGTACGT CGGTGACCCC GCACGGCACC TCGCCACGGC 300 

CCAGTTCAAT CTGCTGAGCA GCACCATGGA CCAGATGAGC AGC CGCGCGG CCTCGGCCAG .360 

CCCCTACACC CCAGAGCACG CCGCCAGCGT GCCCACCCAC TCGCCCTACG CACAACCCAG 420 

CTCCACCTTC GACACCATGT CGCCGGCGCC TGTCATCCCC TCCAACACCG ACTACCCCGG 4 80 

ACCCCACCAC TTTGAGGTCA CTTTCCAGCA GTCCAGCACG GCCAAGTCAG CCACCTGCAC 540 

GTACTCCCCG CTCTTGAAG 55 9 
(2) INFORMATION POUR LA SEQ ID NO: 12: 

(i) CARACTERI STIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 1764 paires de bases 

(B) TYPE: acide nuclei que 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION; lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISMS: Homo sapiens 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

ATGCTGTACG TCGGTGACCC CGCACGGCAC CTCGCCACGG CCCAGTTCAA TCTGCTGAGC 60 

AGCACCATGG AC CAGATGAG CAGCCGCGCG GCCTCGGCCA GCCCCTACAC CCCAGAGCAC 120 

GCCGCCAGCG TGCCCACCCA CTCGCCCTAC GCACAACCCA GCTCCACCTT CGACACCATG 180 

TCGCCGGCGC CTGTCATCCC CTCCAACACC GACTACCCCG GACCCCACCA CTTTGAGGTC 240 

ACTTTCCAGC AGTCCAGCAC GGCCAAGTCA GCCACCTGGA CGTACTCCCC GCTCTTGAAG 300 

AAACTCTACT GCCAGATCGC CAAGACATGC CCCATCCAGA TCAAGGTGTC CACCCCGCCA 360 

CCCCCAGGCA CTGCCATCCG GGCCATGCCT GTTTACAAGA AAGCGGAGCA CGTGACCGAC 420 
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GTCGTGAAAC 


GCTGCCCCAA 


CCACGAGCTC 


QGGAGGGACT 


TCAACGAAGG 


ACAGTCTGCT 


460 


CCAGCCAGCC 


ACCTCATCCG 


CGTGGAAGGC 


AATAATCTCT 


CGCAGTATGT 


GGATGACCCT 


S40 


GTCACCGGCA 


GGCAGAGCGT 


CGTGGTGCCC 


TATGAGCCAC 


CACAGGTGGG 


GACGGAATTC 


600 


ACCACCATCC 


TGTACAACTT 


CATGTGTAAC 


AGCAGCTGTG 


TAGGGGGCAT 


GAAC C GGC GG 


660 


CCCATCCTCA 


T CAT CATC AC 


CCTGGAGATG 


CGGGATGGGC 


AGGTGCTGGG 


CCGCCGGTCC 


720 


TTTGAGGGCC 


GCATCTGCGC 


CTGTCCTGGC 


CGCGACCGAA 


AAGCTGATGA 


GGACCACTAC 


780 


CGGGAGCAGC 


AGGCCCTGAA 


CGAGAGCTCC 


GCCAAGAACG 


GGGCCGCCAG 


CAAGCGTGCC 


840 


TTCAAGCAGA 


GCCCCCCTGC 


CGTCCCCGCC 


CTTGGTGCCG 


GTGTGAAGAA 


GC GGC GGC AT 


900 


GGAGACGAGG 


ACACGTACTA 


CCTTCAGGTG 


CGAGGCCGGG 


AGAACTTTGA 


GATCCTGATG 


960 


AAGCTGAAAG 


AGAGCCTGGA 


GCTGATGGAG 


TTGGTGCCGC 


AGCCACTGGT 


GGACTCCTAT 


1020 


CGGCAGCAGC 


AGCAGCTCCT 


AC AGAGGCC G 


AGTCACCTAC 


AGCCCCCGTC 


CTACGGGCCG 


1080 


GTCCTCTCGC 


C CAT GAAC AA 


GGTGCACGGG 


GGC ATGAAC A 


AGCTGCCCTC 


CGTCAACCAG 


1140 


CTGGTGGGCC 


AGCCTCCCCC 


GCACAGTTCG 


GCAGCTACAC 


CCAACCTGGG 


GCCCGTGGGC 


1200 


CCCGGGATGC 


TCAACAAC C A 


TGGCCACGCA 


GTGCCAGCCA 


AC GGC GAG AT 


GAGCAGCAGC 


1260 


CACAGCGCCC 


AGTCCATGGT 


CTCGGGGTCC 


CACTGCACTC 


CGCCACCCCC 


CTACCACGCC 


1320 


GACCCCAGCC 


TCGTCAGTTT 


TTTAACAGGA 


TTGGGGTGTC 


CAAACTGCAT 


CGAGTATTTC 


1380 


ACC TC C C AAG 


GGT T AC AGAG 


C ATT T AC C AC 


CTGCAGAAC C 


TGAC CATTGA 


GGACCTGGGG 


1440 


GCCCTGAAGA 


TCCCCGAGCA 


GTACCGCATG 


ACCATCTGGC 


GGGGCCTGCA 


GGACCTGAAG 


1500 


CAGGGCCACG 


ACTACAGCAC 


CGCGCAGCAG 


CTGCTCCGCT 


CTAGCAACGC 


GGCCACCATC 


1560 


TCCATCGGCG 


GCTCAGGGGA 


ACTGCAGCGC 


CAGCGGGTCA 


TGGAGGCCGT 


GCACTTCCGC 


1620 


GTGCGCCACA 


CCATCACCAT 


CCCCAACCGC 


GGC GGC CC AG 


GCGGCGGCCC 


TGACGAGTGG 


1680 


GCGGACTTCG 


GCTTCGACCT 


GCCCGACTGC 


AAGGCCCGCA 


AGCAGCCCAT 


CAAGGAGGAG 


1740 


TTCACGGAGG 


C C GAGATC C A 


CTGA 








1764 



(2) INFORMATION POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 587 acides amines 
(8) TYPE: acide amine 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

Met Leu Tyr Val Gly Asp Pro Ala Arg His Leu Ala Thr Ala Gin Phe 

1 5> 10 15 

Asn Leu Leu Ser Ser Thr Mec Asp Gin Met Ser Ser Arg Ala Ala Ser 
20 25 30 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser 
35 40 45 

Pro Tyr Ala Gin Pro Ser Ser thr Phe Asp Thr Met Ser Pro Ala Pro 
50 55 60 
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Val lie Pro Ser Aan Thr Asp Tyr Pro Gly Pro His His Phe Glu Val 
65 70 75 BO 

Thr Phe Gin Gin Ser ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser 
B5 90 95 

Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro lie 
100 105 110 

Gin lie Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala 
115 120 125 

Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arg 
130 135 140 

Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala 
145 150 155 160 

Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr 
165 170 175 

Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 
180 185 190 

Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met 
195 200 205 

Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu He 
210 215 220 

He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 240 

Phe Glu Gly Arg He Cys Ala Cy3 Pro Gly Arg Asp Arg Lys Ala Asp 
245 250 255 

Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys 
260 265 270 

Ash Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val 
275 280 285 

Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp 
290 295 300 

Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu Met 
305 310 315 320 

Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
325 330 335 

Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His 
340 345 350 

Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys val 
355 360 365 

His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin 
370 375 380 

Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly 
385 390 395 400 

Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly Glu 
405 410 415 

Met ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His Cys 
420 425 430 

Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu 
435 440 445 
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Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin Gly 
450 455 * 460 

Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu Gly 
465 470 475 480 

Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu 
465 490 495 

Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu 
500 505 510 

Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu 
515 520 525 

Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg val Arg His Thr 
530 535 540 

He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp 
545 550 555 560 

Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro 
565 570 575 

He Lys Glu Glu Phe Thr Glu Ala Glu He His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1521 paires de bases 

(B) TYPE: acide nuclei que 

(C) NO MB RE DE BRINS : double 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE : 

(A) ORGANISME: Homo sapiens 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

ATGCTGTACG TCGGTGACCC CGCACGGCAC CTCGCCACGG CCCAGTTCAA TCTGCTGAGC 60 

AGCACCATGG AC C AGATGAG CAGCCGCGCG GCCTCGGCCA GCCCCTACAC CCCAGAGCAC 120 

GCCGCCAGCG TGCCCACCCA CTCGCCCTAC GCACAACCCA GCTCCACCTT CGACACCATG 180 

TCGCCGGCGC CTGTCATCCC CTCCAACACC GACTACCCCG GACCCCACCA CTTTGAGGTC 2 40 

ACTTTCCAGC AGTCCAGCAC GGCCAAGTCA GCCACCTGGA CGTACTCCCC GCTCTTGAAG 300 

AAACTCTACT GCCAGATCGC CAAGACATGC CCCATCCAGA TCAAGGTGTC CACCCCGCCA 360 

CCCCCAGGCA CTGCCATCCG GGCCATGCCT GTTTACAAGA AAGCGGAGCA CGTGACCGAC 4 20 

GTCGTGAAAC GCTGCCCCAA CCACGAGCTC GGGAGGGACT TCAACGAAGG ACAGTCTGCT 460 

CCAGCCAGCC ACCTCATCCG CGTGGAAGGC AATAATCTCT CGCAGTATGT GGATGACCCT 5 40 

GTCACCGGCA GGCAGAGCGT CGTGGTGCCC TAT GAGC C AC CACAGGTGGG GACGGAATTC 600 

ACCACCATCC TGTACAACTT CATGTGTAAC AGCAGCTGTG TAGGGGGCAT GAACCGGCGG 660 

CCCATCCTCA TCATCATCAC CCTGGAGATG CGGGATGGGC AGGTGCT GGG CCGCCGGTCC 720 

TTTGAGGGCC GCATCTGCGC CTGTCCTGGC CGCGACCGAA AAGC T GATGA GGACCACTAC 780 

CGGGAGCAGC AGGCCCTGAA CGAGAGCTCC GCCAAGAACG GGGCCGCCAG CAAGCGTGCC 840 

TTCAAGCAGA GCCCCCCTGC CGTCCCCGCC CTTGGTGCCG GTGTGAAGAA GCGGCGGCAT 900 
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GG AG AC GAGG ACACGTACTA CCTTCAGGTG CGAGGCCGGG AGAACTTTGA GATCCTGATG 960 

AAGCTGAAAG AGAGCCTGGA GCTGATGGAG TTGGTGCCGC AGCCACTGGT GGACTCCTAT 1020 

CGGCAGCAGC AGCAGCTCCT ACAGAGGCCG CCCCGGGATG CTCAACAACC ATGGCCACGC 1080 

AGTGCCAGCC AACGGCGAGA TGAGCAGCAG CCACAGCGCC CAGTCCATGG TCTCGGGGTC 114 0 

CCACTGCACT CCGCCACCCC CCTACCACGC CGACCCCAGC CTCGTCAGGA CCTGGGGGCC 1200 

CTGAAGATCC CCGAGCAGTA CCGCATGACC ATCTGGCGGG GCCTGCAGGA CCTGAAGCAG 12 60 

GGCCACGACT ACAGCACCGC GCAGCAGCTG CTCCGCTCTA GCAAC GCGGC CACCATCTCC 1320 

ATCGGCGGCT CAGGGGAACT GCAGCGCCAG CGGGTCATGG AGGCCGTGCA CTTCCGCGTG 1380 

CGCCACACCA TCACCATCCC CAACCGCGGC GGCCCAGGCG GCGGCCCTGA CGAGTGGGCG 14 40 

GACTTCGGCT TCGACCTGCC CGACTGCAAG GCCCGCAAGC AGCCCATCAA GGAGGAGTTC 1500 

ACGGAGGCCG AGATCCACTG A 1521 
(2) INFORMATION POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 506 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

Met Leu Tyr Val Gly Asp Pro Ala Arg His Leu Ala Thr Ala Gin Phe 
1 5 10 15 

Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser 
20 25 30 

Ala ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser 
35 40 45 

Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
50 55 60 

Val He Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val 
65 70 75 80 

Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser 
85 90 95 

Pro Leu Leu Lys Lya Leu Tyr Cys Gin He Ala Lys Thr Cys Pro lie 
100 105 110 

Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala 
115 120 125 

Met Pro val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arg 
130 135 140 

Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala 
145 iso 155 160 

Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr 
165 170 175 

Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 
180 185 190 



(C) 2000 Copyright Derwent Information Ltd. 



WO 97/28186 



66 



PCT/FR97/00214 



Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met 
193 200 20S 

Cys Asn Ser Ser cys Val Gly Gly Met Asn Arg Arg Pro lie Leu He 
210 215 220 

He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 240 

Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp 
245 250 255 

Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys 
260 265 • 270 

Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val 
275 260 295 

Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp 
290 295 300 

Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu Met 
305 310 315 320 

Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
325 330 335 

Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Pro Arg 
340 345 350 

Asp Ala Gin Gin Pro Trp Pro Arg Ser Ala Ser Gin Arg Arg Asp Glu 
355 360 365 

Gin Gin Pro Gin Arg Pro Val His Gly Leu Gly Val Pro Leu His Ser 
370 375 380 

Ala Thr Pro Leu Pro Arg Arg Pro Gin Pro Arg Gin Asp Leu Gly Ala 
385 390 395 400 

Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin 
405 410 415 

Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg 
420 425 430 

Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu Gin 
435 440 445 

Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr He 
450 455 460 

Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala 
465 470 475 480 

Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He 
485 490 495 

Lys Glu Glu Phe Thr Glu Ala Glu He His 
500 505 

(2) INFORMATION POUR LA SEQ ID NO: 16: 

<i> CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1870 paires de bases 

(B) TYPE: acide nucleique 

(C) N OMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

<vi) ORIGINE: 

(A) ORGANISMS: Homo sapiens 
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(ix) CARACTERISTIQUE ADDITIONELLE : 
(A) NOM/CLE: CDS 
<B) EMPLACEMENT: 104.. 1867 

I 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

I 

TGCCCGGGGC TGCGACGGCT GCAGGGAACC AGACAGCACC TACTTCGACC TTCCCCAGTC 60 

AAGCCGGGGG AATAATGAGG TGGTGGGCGG AACGGATTCC AGC ATG GAC GTC TTC 115 

Met Asp Val Phe 
1 

CAC CTG GAG GGC ATG ACT AC A TCT GTC ATG GCC CAG TTC AAT CTG CTG 163 
His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu 
5 10 15 20 

AGC AGC ACC ATG GAC CAG ATG AGC AGC CGC GCG GCC TCG GCC AGC CCC 211 

Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro ' 
25 30 35 

TAC ACC CCA GAG CAC GCC GCC AGC GTG CCC ACC CAC TCG CCC TAC GCA 25 9 

Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala 
40 45 50 

CAA CCC AGC TCC ACC TTC GAC ACC ATG TCG CCG GCG CCT GTC ATC CCC 307 
Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val lie Pro 
55 60 65 

TCC AAC ACC GAC TAC CCC GGA CCC CAC CAC TTT GAG GTC ACT TTC CAG 355 
Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin 
70 75 80 

CAG TCC AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCG CTC TTG 403 

Gin Ser Ser Thr Ala Lys ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu , 
85 90 95 100 . I 

AAG AAA CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG 451 | 

Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro He Gin He Lys 
105 110 H5 

GTG TCC ACC CCG CCA CCC CCA GGC ACT GCC ATC CGG GCC ATG CCT GTT 4 99 

Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val 
120 125 130 

TAC AAG AAA GCG GAG CAC GTG ACC GAC GTC GTG AAA CGC TGC CCC AAC 547 
Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arg Cys Pro Asn 
135 140 145 

CAC GAG CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCT CCA GCC AGC 5 95 ' 

His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser 
150 155 160 

CAC CTC ATC CGC GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAT GAC 64 3 

His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp 
165 170 175 180 

CCT GTC ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG 691 
Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin 
185 190 195 

GTG GGG ACG GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC 739 
Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser 
200 205 210 

AGC TGT GTA GGG GGC ATG AAC CGG CGG CCC ATC CTC ATC ATC ATC ACC 787 

Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr J 
215 220 225 

CTG GAG ATG CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTT GAG GGC 8 35 1 

Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly 
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230 235 240 

CGC ATC TGC GCC TGT CCT GGC CGC GAC CGA AAA GCT GAT GAG GAC CAC 683 

Arg lie Cys Ala Cys Pro Gly Arg Asp Arg Ly3 Ala Asp Glu Asp His 
245 250 255 260 

TAC CGG GAG CAG CAG GCC CTG AAC GAG AGC TCC GCC AAG AAC GGG GCC 931 ' 

Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala 
265 270 275 

GCC AGC AAG CGT GCC TTC AAG CAG AGC CCC CCT GCC GTC CCC GCC CTT 979 
Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu 
280 285 290 

GGT GCC GGT GTG AAG AAG CGG CGG CAT GGA GAC GAG GAC ACG TAC TAC 1027 
Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr 
295 300 305 

CTT CAG GTG CGA GGC CGG GAG AAC TTT GAG ATC CTG ATG AAG CTG AAA 1075 
Leu Gin Val Arg Gly Arg Glu Asn Phe Glu lie Leu Met Lys Leu Lys 
310 315 320 

GAG AGC CTG GAG CTG ATG GAG TTG GTG CCG CAG CCA CTG GTG GAC TCC 1123 , 

Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser I 
325 330 335 340 

! 

TAT CGG CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC 1171 
Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro 
345 350 355 

CCG TCC TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC 1219 
Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly 
360 365 370 

ATG AAC AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG 1267 
Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro 
375 380 385 

CAC AGT TCG GCA GCT ACA CCC AAC CTG GGG CCC GTG GGC CCC GGG ATG 1315 
His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Pro Gly Met 
390 395 400 

CTC AAC AAC CAT GGC CAC GCA GTG CCA GCC AAC GGC GAG ATG AGC AGC 1363 
Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly Glu Met Ser Ser 
405 410 415 420 

AGC CAC AGC GCC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA 1411 
Ser His Ser Ala Gin Ser Met Val Ser Gly Ser Hia Cys Thr Pro Pro 
425 430 435 

CCC CCC TAC CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG 14 59 

Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu 
440 445 450 

GGG TGT CCA AAC TGC ATC GAG TAT TTC ACC TCC CAA GGG TTA CAG AGC 1507 | 

Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser 

455 460 465 1 

ATT TAC CAC CTG CAG AAC CTG ACC ATT GAG GAC CTG GGG GCC CTG AAG 1555 
He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu Gly Ala Leu Lys 
470 475 480 

ATC CCC GAG CAG TAC CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG 1603 
He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin Asp Leu 
485 490 495 500 

AAG CAG GGC CAC GAC TAC AGC ACC GCG CAG CAG CTG CTC CGC TCT AGC 16S1 
Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg Ser Ser 

505 510 515 / 

AAC GCG GCC ACC ATC TCC ATC GGC GGC TCA GGG GAA CTG CAG CGC CAG 1699 
Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin 
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520 525 530 

CGG GTC ATG GAG GCC GTG CAC TTC CGC GTG CGC CAC ACC ATC ACC ATC 17 47 

Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr He Thr He 
535 540 545 

CCC AAC CGC GGC GGC CCA GGC GGC GGC CCT GAC GAG TGG GCG GAC TTC 1795 ' 

Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe 
550 555 560 

GGC TTC GAC CTG CCC GAC TGC AAG GCC CGC AAG CAG CCC ATC AAG GAG 1843 
Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro lie Lys Glu 
565 570 57S 580 

GAG TTC ACG GAG GCC GAG ATC CAC TGA 1870 
Glu Phe Thr Glu Ala Glu He His 
585 

(2) INFORMATION POUR LA SEQ ID NO: 17 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 588 acides amines I 

( B) TYPE: acide amine 

(D) CONFIGURATION: lineaire ^ 
(ii) TYPE DE MOLECULE: proteine 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17 t 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
15 10 15 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
20 25 30 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 

35 40 45 ' 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
50 55 60 

Pro Val He Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
65 70 75 BO 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
85 90 95 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro 
100 105 110 

He Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg 
115 120 125 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys I 
130 135 140 



Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
145 150 155 160 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
165 170 175 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
180 185 190 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
195 200 205 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
210 215 220 



1 
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lie lie lie Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg 
225 230 235 240 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
245 250 255 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
260 265 270 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
275 280 285 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
290 295 300 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
305 310 315 320 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
325 330 335 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro ser 
340 345 350 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
355 360 365 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
370 375 380 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
385 390 395 400 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
405 410 415 

Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
420 425 430 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
435 440 445 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin 
450 455 460 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
465 470 475 480 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly 
485 490 495 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu 
500 505 510 

Leu Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
S15 520 525 

Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
530 535 540 

Thr He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu 
545 550 555 560 

Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin 
S65 570 575 

Pro He Lys Glu Glu Phe Thr Glu Ala Glu He His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 1817 paires de bases 

( 8 ) TYPE: acide nucleique 

(C) NOMBRE DE BRINS ; double 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 



ATGGCCCAGT 


CCACCGCCAC 


CTCCCCTGAT 


GGGGGCACCA 


CGTTTGAGCA 


CCTCTGGAGC 


60 


TCTCTGGAAC 


CAGACAGCAC 


CTACTTCGAC 


CTTCCCCAGT 


CAAGCCGGGG 


GAATAATGAG 


120 


GTGGTGGGCG 


GAACGGATTC 


CAGCATGGAC 


GTCTTCCACC 


TGGAGGGCAT 


GACTACATCT 


180 


GTCATGCCCC 


AGTTCAATCT 


GCTGAGCAGC 


ACCATGGACC 


AGATGAGCAG 


CCGCGCGGCC 


240 


TCGGCCAGCC 


CCTACACCCC 


AGAGCACGCC 


GCCAGCGTGC 


CCACCCACTC 


GCCCTACGCA 


300 


CAACCCAGCT 


CCACCTTCGA 


CACCATGTCG 


CCGGCGCCTG 


TCATCCCCTC 


CAACACCGAC 


360 


TACCCCGGAC 


CCCACCACTT 


TGAGGTCACT 


TTCCAGCAGT. CCAGCACGGC 


CAAGTCAGCC 


420 


ACCTGGACGT 


ACTCCCCGCT 


CTTGAAGAAA 


CTCTACTGCC 


AGATCGCCAA 


GACATGCCCC 


480 


ATCCAGATCA 


AGGTGTC C AC 


CCCGCCACCC 


CCAGGCACTG 


CCATCCGGGC 


CATGCCTGTT 


540 


TACAAGAAAG 


CGGAGCACGT 


GACCGACGTC 


GTGAAACGCT 


GCCCCAACCA 


CGAGCTCGGG 


600 


AGGGACTTCA AC GAAGGAC A 


GTCTGCTCCA 


GCCAGCCACC 


TCATCCGCGT 


GGAAGGCAAT 


660 


AATCTCTCGC 


AGTATGTGGA TGACCCTGTC 


ACCGGCAGGC 


AGAGCGTCGT 


GGTGCCCTAT 


720 


GAGCCACCAC 


AGGT GGGGAC 


GGAATTCACC 


ACCATCCTGT 


ACAACTTCAT 


GTGTAACAGC 


760 


AGCTGTGTAG 


GGGGCATGAA 


CCGGCGGCCC 


ATCC T CAT CA 


TCATCACCCT 


GGAGATGCGG 


640 


GATGGGCAGG 


TGCTGGGCCG 


CCGGTCCTTT 


GAGGGCCGCA 


TCTGCGCCTG 


TCCTGGCCGC 


900 


GACCGAAAAG 


CTGATGAGGA CCACTACCGG 


GAGCAGCAGG 


CCCTGAACGA 


GAGCTCCGCC 


960 


AAGAACGGGG 


CCGCCAGCAA 


GCGTGCCTTC 


AAGCAGAGCC 


CCCCTGCCGT 


CCCCGCCCTT 


1020 


GGTGCCGGTG 


TGAAGAAGCG 


GCGGCATGGA 


GACGAGGACA 


CGTACTACCT 


TC AGGT GC GA 


1080 


GGCCGGGAGA 


ACT T TGAGAT 


CCTGATGAAG 


CTGAAAGAGA 


GCCTGGAGCT 


GATGGAGTTG 


1140 


GTGCCGCAGC 


CACTGGTGGA 


CTCCTATCGG 


CAGCAGCAGC 


AGCTCCTACA 


GAGGCCGAGT 


1200 


CACCTACAGC 


CCCCGTCCTA 


CGGGCCGGTC 


CTCTCGCCCA 


TGAACAAGGT 


GCACGGGGGC 


1260 


ATGAACAAGC 


TGCCCTCCGT 


CAACCAGCTG 


GTGGGCCAGC 


CTCCCCCGCA 


CAGTTCGGCA 


1320 


GCTACACCCA 


ACCTGGGGCC 


CGTGGGCCCC 


GGGATGCTCA 


ACAACCATGG 


CCACGCAGTG 


1380 


CCAGCCAACG 


GCGAGATGAG 


CAGCAGCCAC 


AGCGCCCAGT 


CCATGGTCTC 


GGGGTCCCAC 


1440 


TGCACTCCGC 


CACCCCCCTA 


CCACGCCGAC 


CCCAGCCTCG 


TCAGGACCTG 


GGGGCCCTGA 


1500 


AGATCCCCGA 


GCAGTACCGC 


ATGACCATCT 


GGCGGGGCCT 


GCAGGACCTG 


AAGCAGGGCC 


1560 


ACGACTACAG 


CACCGCGCAG 


CAGCTGCTCC 


GCTCTAGCAA 


CGCGGCCACC 


ATCTCCATCG 


1620 


GCGGCTCAGG 


GGAAC T GC AG 


CGCCAGCGGG 


TCATGGAGGC 


CGTGCACTTC 


CGCGTGCGCC 


1680 


ACACCATCAC 


CATCCCCAAC 


CGCGGCGGCC 


CAGGCGGCGG 


CCCTGACGAG 


TGGGCGGACT 


1740 


TCGGCTTCGA 


CCTGCCCGAC 


TGCAAGGCCC 


GCAAGCAGCC 


CATCAAGGAG 


GAGTTCACGG 


1B00 
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AGGCCGAGAT CCACTGA 

(2) INFORMATION POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 99 acides amines 

(B) TYPE: acide aroint 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

Met Ala Gin Sex Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
15 10 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
s 0 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 7 0 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 no 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
130 135 140 y 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 
145 ISO 155 Y ago 

He Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Aro 
165 170 175 * 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lvs 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin ser Val Val Val Pro Tvr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
. 245 2S0 255 

Met Cys Asn ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 

260 265 270 

He He lie Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 

295 300 
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Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 * 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu lie Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
450 455 460 

Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Arg Thr 
485 490 495 

Trp Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 20: 

(i) CARACTERI5TIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucl6ique 

(C) NOMBRE DE BRINS : simple 
{ 0} CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 
GCGAGCTGCC CTCGGAG 17 
(2) INFORMATION POUR LA SEQ ID NO: 21: 

(i) CARACTER I ST I QUE5 DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 
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<xi) DESCRIPTION DE LA SEQUENCE i SEQ ID NO: 21: 
GGTTCTGCAG GTGACTCAG 19 
(2) INFORMATION POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE; acide nucleique 
<C) NOME RE DE BRINS : simple 
(D) CONFIGURATION; lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 
GCCATGCCTG TCTACAAG 18 
(2) INFORMATION POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(iij TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
ACCAGCTGGT TGACGGAG 18 
(2) INFORMATION POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DS MOLECULE: ADN . . . 

(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GTCAACCAGC TGGTGGGCCA G 21 
(2) INFORMATION POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 
GTGGATCTCG GCCTCC 16 
(2) INFORMATION POUR LA SEQ ID NO: 26: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucleique 
(CJ N OMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: NON 



(xx) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
AGGCCGGCGT GGGGAAG 17 
(2) INFORMATION POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: \ 
CTTCGCGATC TGGCAGTAG 19 
(2) INFORMATION POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



Ui) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
GCGGCCACGA CCGTGAC 17 
(2) INFORMATION POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE; ADN 
(iii) ANTI-SENS: OUI 
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(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 
GGCAGCTTGG GTCTCTGG 18 
(2) INFORMATION POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 
CTGTACGTCG GTGACCCC 18 
(2) INFORMATION POUR LA SEQ ID NO: 31: 

<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucle.ique 

(C) NOMBRE DE BRINS: simple 
(D> CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 
TCAGTGGATC TCGGCCTC 18 
(2) INFORMATION POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 
AGGGGACGCA GCGAAACC 18 
(2) INFORMATION POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



T 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 
CCATCAGCTC CAGGCTCTC 

(2) INFORMATION POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 
<D> CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 
CCAGGACAGG CGCAGATG 

(2) INFORMATION POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN ' 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 
GAT GAGGTGG CTGGCTGGA 

(2) INFORMATION POUR LA SEQ ID NO: 36: 

(i| CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36: 
TGGTCAGGTT CTGCAGGTG 

(2) INFORMATION POUR LA SEQ ID NO: 37: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



T 
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(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31 : 
CACCTACTCC AGGGATGC * 8 
(2) INFORMATION POUR LA SEQ ID NO: 38: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3B: 
AGGAAAATAG AAGCGTCAGT C 

(2) INFORMATION POUR LA SEQ ID NO: 39: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
ID) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii). ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39: . 
CAGGCCCACT TGCCTGCC 18 
(2) INFORMATION POUR IA SEQ ID NO: 40: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40: 
CTGTCCCCAA GCTGATGAG 1* 



43 



x 
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REVENDICATIONS 



1. Polypeptide purifie, comprenant une sequence decides amines choisie parmi : 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) fa sequence SEQ ID n° 8 ; 

e) la sequence SEQ ID n° 10 ; 
0 la sequence SEQ ID n°13 ; 

g) ta sequence SEQ ID n° 15 ; 

h) la sequence SEQ ID n° 17 ; 

i) (a sequence SEQ ID n° 19 ; 

et j) toute sequence biologiquement active derivee de SEQ ID n° 2, SEQ ID n° 4, 
SEQ ID n° 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 
ouSEQIDn°19. 



2. Polypeptide selon la revendication 1 f caracteris6 en ce qu'il comprend la sequence 
decides amines choisie parmi SEQ ID n° 6. SEQ ID n° 13, SEQ ID n° 15, SEQ ID 
n°17etSEQIDn°19. 

3. Polypeptide selon la revendication 1, caract6rise en ce qu'il comprend la sequence 
comprise entre : 

- !e residu 1 10 et le residu 310 de SEQ ID n° 2 ou 6 ; 

- le residu 60 et le residu 260 de SEQ ID n° 8. 

4. Polypeptide selon la revendication 1, caracterise en ce qu'il rtsuite d'un epissage 
altematif de i'ARN messager du gdne correspondant. 

5. Polypeptide selon Tune quelconque des revendications precedentes, caracterise 
en ce qu'il s'agit d'un polypeptide recombinant produit sous la forme tfune proteine 
de fusion. 

6. Sequence d'acides nucldiques isotee codant pour un polypeptide selon Tune 
quelconque des revendications precedentes. 



■t 
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7. Sequence d'acides nucleiques isolee selon la revendication 6, caracterisee en ce 
qu'elle est choisie parmi : 

a) la sequence SEQ ID n° 1 ; 

b) la sequence SEQ ID n° 3 ; 
5 c) la sequence SEQ ID n° 5 ; 

d) la sequence SEQ ID n°7 ; 

e) la sequence SEQ ID n°9 ; 

f ) la sequence SEQ ID n° 11 ; 

g) la sequence SEQ ID n° 12 ; 
10 h) la sequence SEQ ID n° 14 ; 

i) la sequence SEQ ID n° 16 ; 
j) la sequence SEQ ID n° 18 ; 

k) les sequences d'acides nucleiques capables de s'hybrider specifiquement £ la 
sequence SEQ ID n° 1, SEQ ID n° 3, SEQ ID n° 5, SEQ ID n°7, SEQ ID n°9, SEQ 
15 ID n° 11, SEQ ID h°12, SEQ ID n° 14 ( SEQ ID n 6 16 ou SEQ ID n° 18 ou a leurs 

sequences compl6mentaires, ou de s'hybrider specifiquement a leurs sequences 
proxi males.; 

et I) les sequences d6riv6es des sequences a), b), c), d) f e), f). g). h), i), j) ou k) du 
fait de la degenerescence du code genetique, de mutation, de deletion, d'insertion, 
20 d'un epissage alternatif ou d'une variabilite allelique. 

8. Sequence nucleotidique selon la revendication 6, caracterisee en ce qu'il s'agit 
d une sequence choisie parmi SEQ ID n° 5, SEQ ID n° 12, SEQ ID n° 14, SEQ ID 
n° 16 et SEQ ID n° 18 codant respectivement pour la polypeptide de sequences 

25 SEQ ID n° 6, SEQ ID n° 13, SEQ ID n° 15, SEQ ID n° 17 et SEQ ID n° 19. 

9. Vecteur de clonage et/ou d'expression contenant une sequence d'acides 
nucleiques selon Tune quelconque des revendications 6 £ 8. 

30 10. Vecteur selon la revendication 9, caracterise en ce qu'il s'agit du plasmide pSE1 . 

11. Cellule hdte transfectee par un vecteur selon la revendication 9 ou 10. 

12. Cellule hdte transfectee selon la revendication 11, caracterisee en ce qu'il s'agit 
35 de£. CO//MC1061. 
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13. Sonde nucleotidique ou amorce nucleotidique caracterisee en ce qu'elle s'hybride 
specifiquement avec Tune quelconque des sequences selon tes revendications 6 
a 8 ou leurs sequences complementaires ou les ARN messagers correspondants 
ou les genes correspondants. 

5 

14. Sonde ou amorce selon ta revendication 13, caracterisee en ce qu'elle comporte 
au moins 16 nucleotides. 



10 



15. Sonde ou amorce selon la revendication 13, caracterisee en ce qu'etle comprend 
I'integralitd de la sequence du gene codant pour Tun des polypeptides de la 
revendication 1. 



16. Sonde ou amorce nucleotidique choisie parmi les oligonucleotides suivants bu 
leurs complementaires ; 



15 



20 



25 



30 



35 



SEQ 


10 


n° 


20: 


GCG AGC TGC CCT CGG AG 


SEQ 


ID 


n° 


21 : 


GGT TCT GCA GGT GAC TCA G 


SEQ 


ID 


n° 


22: 


GCC ATG CCT GTC TAC AAG 


SEQ 


ID 


n° 


23: 


ACC AGC TGG TTG ACG GAG 


SEQ 


ID 


n° 


24: 


GTC AAC CAG CTG GTG GGC CAG 


SEQ 


ID 


n" 


25: 


GTG GAT CTC GGC CTC C 


SEQ 


ID 


n° 


26: 


AGG CCG GCG TGG GGA AG 


SEQ 


ID 


n° 


27: 


CTT GGC GAT CTG GCA GTA G 


SEQ 


ID 


n° 


28: 


GCG GCC ACG ACC GTG AC 


SEQ 


ID 


n° 


29: 


GGC AGC TTG GGT CTC TGG 


SEQ 


ID 


n° 


30: 


CTG TAC GTC GGT GAC CCC 


SEQ 


ID 


n° 


31 : 


TCA GTG GAT CTC GGC CTC 


SEQ 


ID 


n' 


32: 


AGG GGA CGC AGC GAA ACC 


SEQ 


ID 


n° 


33: 


CCA TCA GCT CCA GGC TCT C 


SEQ 


ID 


n° 


34: 


CCA GGA CAG GCG CAG ATG 


SEQ 


ID 


n° 


35: 


GAT GAG GTG GCT GGC TGG A 


SEQ 


ID 


n° 


36: 


TGG TCA GGT TCT GCA GGT G 


SEQ 


ID 


n° 


37: 


CAC CTA CTC CAG GGA TGC 


SEQ 


ID 


n° 


36: 


AGG AAA ATA GAA GCG TCA GTC 


SEQ 


ID 


n B 


39: 


CAG GCC CAC TTG CCT GCC 


et SEQ 


ID n" 40 : CTG TCC CCA AGC TGA TGA G 
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17. Utilisation d'une sequence selon Tune quelconque des revendications 6 a 8 pour 
la fabrication d'amorces oligonucleotidiques pour des reactions de sequen?age 
ou d'amplification specifique selon la technique de PCR ou toute variante de 
celle-ci. 



18. Couple d'amorces nucteotidiques, caract6rise en ce qu'il comprend les amorces 
choisies parmi les sequences suivantes : 

a) amorce sens : GCG AGC TGC CCT CGG AG (SEQ ID n° 20) 

amorce antisens : GGT TCT GCA GGT GAC TCA G (SEQ ID n° 21) 



b) amorce sens : GCC ATG CCT GTC TAC AAG (SEQ ID n°22) 
amorce antisens : ACC AGC TGG TTG ACG GAG (SEQ ID n° 23) 

15 

c) amorce sens : GTC AAC CAG CTG GTG GGC CAG (SEQ ID n° 24) 
amorce antisens : GTG GAT CTC GGC CTC C (SEQ ID n° 25) 

d) amorce sens : AGG CCG GCG TGG GGA AG (SEQ ID n° 26) 

20 amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 



e) amorce sens ; GCG GCC ACG ACC GTG A (SEQ ID n° 28) 

amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n°29) 

25 0 amorce sens : CTG TAC GTC GGT GAC CCC (SEQ ID n°30) 

amorce antisens : TCA GTG GAT CTC GGC CTC (SEQ ID n° 31) 

g) amorce sens : AGG GGA CGC AGC GAA ACC (SEQ ID n° 32) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n° 29) 

30 

h) amorce sens : CCCCCCCCCCCCCCN (oCi N est 6gal a G, A ou T) 
amorce antisens : CCA TCA GCT CCA GGC TCT C (SEQ ID n° 33) 

i) amorce sens : CCCCCCCCCCCCCCN (ou N est egal d G, A ou T) 
35 amorce antisens : CCA GGA CAG GCG CAG ATG (SEQ ID n° 34) 
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j) amorce sens :CCCCCCCCCCCCCCCN (ou N est egal aG.A ou T) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

k) amorce sens : CAC CTA CTC CAG GGA TGC (SEQ ID n° 37) 
5 amorce antisens : AGG AAA ATA GAA GCG TCA GTC (SEQ ID n° 38) 

et I) amorce sens :CAG GCC CAC TTG CCT GCC (SEQ ID n° 39) 

amorce antisens : CTG TCC CCA AGC TGA TGA G (SEQ !D n° 40). 



10 



15 



20 



25 



30 



35 



19. Utilisation d'une sequence seton Tune quelconque des revendications 6 a B, 
utilisable en th6rapie genique. 

20. Utilisation d'une sequence selon Tune quelconque des revendications 6 £ 8,. pour 
la realisation de sondes ou d'amorces nucleotidiques de diagnostic, ou de 
sequences antisens utilisables en therapie genique. 

21. Utilisation d'amorces nucleotidiques selon Tune quelconque des revendications 6 
& 6 pour Je sequen$age. 

22. Utilisation d'une sonde ou amorce selon I'une quelconque des revendications 13 
a 16, comme outil de diagnostic in vitro pour la detection, par des experiences 
d'hybridation, des sequences d'acides nucteiques codant pour un polypeptide 
selon Tune quelconque des revendications 1 £ 4, dans des 6chantillons biologi- 
ques, ou pour la mise en evidence de synthases aberrantes ou d'anomalies 
g6netiques. 

23. M6thode de diagnostic in vitro pour la d6tection de synthases aberrantes ou 
d'anomalies genetiques au niveau des sequences d'acides nucleiques codant 
pour un polypeptide selon I'une quelconque des revendications 1 d 4, 
caract6ris6e en ce qu'elle comprend : 

- la mise en contact d'une sonde nucl6otidique selon Tune quelconque des 
revendications 13 £ 16 avec un echantillon biologique dans des conditions 
permettant la formation d'un complexe d'hybridation entre ladite sonde et la 
susdite sequence nucleotidique, eventuellement apr6s une etape prealable 
d'amplification de la susdite sequence nucleotidique ; 



I 
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- la detection du complexe d'hybridation eventuellement forme ; 

- Eventuellement le sequen$age de la sequence nucleotidique formant le 
complexe d'hybridation avec la sonde de I'invention. 

5 24. Utilisation d'une sequence d'acides nucleiques selon I'une quelconque des 
revendications 6 £ 8, pour la production d'un polypeptide recombinant selon Tune 
quelconque des revendications 1 a 5. 

25. Methode de production d'une proteine recombinante SR-p70, caract6risee en ce 
10 que Ton cultive des cellules transferees selon la revendication 10 ou 11 dans 

des conditions permettant Pexpression d'un polypeptide recombinant de 
sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n e 6, SEQ ID n° 8, SEQ ID n° 10, 
SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 ou SEQ ID n° 19 ou tout fragment ou 
derive biologiquement actif, et que Ton recupere ledit polypeptide recombinant. 

15 

26. Anticorps mono ou polyclonaux ou leurs fragments, anticorps chimeriques ou 
immunoconjugu6s, caracterises en ce qu'ils sont capables de reconnaitre specifi- 
quement un polypeptide selon Tune quelconque des revendications 1 £ 4. 



27. Utilisation des anticorps selon la revendication pr6c6dente, pour la purification ou 
la detection d'un polypeptide selon Tune quelconque des revendications 1 a 4 
dans un £chantillon biologique. 

28. Proc6d6 de diagnostic in vitro de pathologies corr6lees a une expression ou une 
accumulation anormale de proteines SR-p70 t notamment les phenomenes de 
canc6risatlon, A partir d'un prSlevement biologique, caract6ris6 en ce que Ton ' 
met en contact au moins un anticorps selon la revendication 25 avec ledit i 
prdldvement biologique, dans des conditions permettant la formation eventuelJe 

de complexes immunologiques sp£cifiques entre une proteine SR*p70 et le ou 
lesdits anticorps et en ce que Ton detecte les complexes immunologiques specifi- 
ques eventuellement form6s. 



29. Kit pour le diagnostic in vitro d'une expression ou une accumulation anormale de 
proteines SR-p70 dans un prelevement biologique et/ou pour la mesure du taux 
d'expression de celles-ci dans ledit prelevement comprenant : 



T 
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- au moins un anticorps selon la revendication 25, eventuellement fixe sur un 
support, 

- des moyens de revelation de la formation de complexes antigenes/anticorps 
specifiques entre une proteine SR-p70 et ledit anticorps et/ou des moyens de 

5 quantification de ces complexes. 

30. Mdthode pour le diagnostic pr£coce de la formation des tumeurs caracterisee en 
ce que I'on met en evidence dans un echantillon de serum preleve chez un 
individu des auto-anticorps diriges contre une proteine SR-p70 selon les etapes 

10 consistant a mettre en contact un echantillon de serum preleve chez un individu 

avec un polypeptide de invention, eventuellement fixe sur un support, dans des 
conditions permettant la formation de complexes immunologiques specifiques 
entre ledit polypeptide et les auto-anticorps eventuellement presents dans 
I'echantillon de serum, et en ce que Ton d6tecte les complexes immunologiques 

1 5 specifiques eventuellement formes. 

31. Methods de determination d'une variabilite alieiique, d'une mutation, d'une 
del6tiori, d'une insertion, d'une perte d'heterozygotie ou d'une anomalie 
gen6tique du gene SR-p70 caracterisee en ce qu'elle utilise au moins une 

20 sequence nucleotidique selon Tune queiconque des revendications 6^8. 

32. Methode de determination d'une variability alieiique du gene SR-p70 au niveau 
de la position -30 et -20 par rapport A I'ATG d'initiation de I'exon 2 pouvant etre 
impliqu6e dans des pathologies et caracterisee en ce qu'elle comprend au moins: 

25 - une etape au cours de laquefle on precede a ('amplification par PCR de I'exon 2 

du g6ne SR-p70 portant la sequence cibie a I'aide de couple d'amorces 
ollgonucieotidiques selon Tune queiconque des revendications 6 6 8; 

- une etape au cours de laquelle on precede au traitement des produits amplifies 
par un enzyme de restriction dont le site de coupure correspond e I'alieie 
recherche; 

- une etape au cours de laquelle on precede a la detection ou au dosage d'au 
moins I'un des produits de la reaction enzymatique. 



30 



35 



33. Composition pharmaceutique comprenant, a litre de principe actif, un polypeptide 
selon Tune queiconque des revendications 1 a 4. 
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34. Composition pharmaceutique selon la revendication precedente, caracterisee en 
ce qu'elle comprend un polypeptide selon la revendication 2. 

35. Composition pharmaceutique contenant un inhibiteur ou un activateur de I'activite 
5 du SR-p70. 

36. Composition pharmaceutique contenant un polypeptide d6riv6 d'un polypeptide 
selon Tune quelconque des revendications 1 a 5 caract6rise en ce qu'il est un 
inhibiteur ou un activateur du SR-p70. 

10 
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1 TGCCTCCCCGCCCCCGCACCCCCCCCGAGCCCTCTGCTCCTGCCAAGGGG 50 

^ GGGGCTCCGGGG 12 

SI ACGCAGCGAAGCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATG 100 

13 ACACTTGGCGTCCGGGCTGGAAGCGTGCTTTCCAAGACGGTGACACGCTT 62 

101 CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGCCCGGTCTGA 150 

63 CCCTGAGGATTGGCAGCCAGACTGCTTACGGGTCAC . . . TGCCATGGAGG 109 

151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGW^CACCACGTTr 200 

110 AGCCGCAGTCAGATCCCAGCATCGAGCCCCCTCTGAGTCAGGAAACATTT 159 

201 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCG^ 250 

160 TCAGACCTATGGAAACTACTTCCTGAAAACAAC . GTTCTGTCCCCCTTGC 208 

251 CCAGTCAAGCCGGGCGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 

209 CGTCCC^GCGGTGGATGATTTGATGCTCTCTCCGGATGATCTTGCACAA 258 

301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 3 50 

III I I I I I I I I I II 

25g 4^ TTAACTGAAGACCCAGGTC 280 

351 aatttgctgAgcagcac»tgga(^atgagcagccgcgctgcct^ 400 

281 CAGATGAAGCTC CCAGAATGTCAGAGGCTGCTCCCCACA 319 

401 CAGCCCGTACACCCCGGAGCACGC«CCAGCGTGCCCACCCATTCACCCT 450 
320 TGGCCCCCACACCAGCAGCTCCTACACCGGCGGCCCCTGCACCAGCCCC. 368 
451 ACGCACAGCCCAGCTCCACCTTCC»CACCATGTCGCCCG^CTGTCATC 500 

J69 CTCCTGGCCCCTGTCATCCTCTGTC 393 

501 CCCTCCIkACACCGACTATCCC^ 550 
39* AW4U«LmcW^ 

444 GCATTCTGGAACAGCCAAGTCTGTGACTTGCACGTACTCCCCTGACCTCA 493 
601 AGAAACTCTACTGCCAGA'TCGCCAAGACA'icCCCCAT^ "0 

.49* acaJLaUttU^^ 

65! ~CCCCC^ ™ 
701 GAAGOCGWGCACCTGACCGACATCGTC^ 750 

I II I Mill Mil I II 1 1 1 1 II II 

594 GCAGT^CAGCA^TCACTGAGGTCGTGAGGCOCTGCCCCCACCATGAGC 643 

751 TCGGGJIGG<^CTTCAACGAAGGACAGTCTGCCCCAGCCAGCCACCTCATC 800 

6 44 oMcnaiiUJ^ ^CTCCXCAAci^iU 687 

801 CGT(?KKAAG«^TAATCTCTCG^ 

688 CCAG^UoGaU^ "7 

851 CAGGCAGAGCGTCCTGG7GCCCTATGAGCCACCACAGCT 900 f 1 U ■ I 

738 OiUWUW^^ ™ 



(C) 2000 Copyright Derwent Information Ltd 



WO 97/28186 



PCT/FR97/00214 



2 /36 



901 
788 
951 
838 
1001 
888 
1051 
938 
1101 
972 
1151 
1022 
1200 
1072 
1250 
1116 
1300 
1158 
1350 
1206 
1400 
1256 
1450 
1301 
1500 
1350 
1550 
1400 



TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTCTGTGGGGGGC 

1 1 1 1 1 1 1 1 1 1 mini iniiiiiiiii iti mi in 

GT ACC AC C ATCC ACT AC AACT AC ATGTGT AAC AGTTCCTGC ATGGGCGGC 
ATGAACCGACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGCATGG 

inn iii illinium ii urn inn m 

ATGAACCGGAGGCCCATCCTCACAATTATCACACTGCAAGACTCCAGTGG 
GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 

f I Mill II III lilt II I II Milium 

T AATC T ACTGGG ACGGAAC AGCTTTG AGGTGCG AGTTTGTGCCTGTCCTG 
GCCGCGACCGAAAAGCCCATCACGACCACTACCGGGAGCAGCAGGCCTTG 

I I Mill I II II II I Ml I 

GGAGAGACCGGCGCACAGAGGAAGAGAATTTCC G 



950 

837 

1000 

887 

1050 

937 

1100 

971 



AATGAGAGCTCCGCCAAGAACGOGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

i il II III I I llllll II Ml 

C AAG AAAGGGG AG C CTTGC CACG AGCTGCCCC CTGGG AGC ACT AAGCG AG 1021 



GAGTCCCCCTGCCGTCCCCCCCCTGGGCCC . GGGTGTGAAGAAGCGGCGG 
I I 111 M III III I MIMI I I . 

CACTGCCCAACAACACCAGCTCCTCTCCCCAGCCAAAGAAGAAACCACTG 



C ACGGAGACG AGGAC ACGTACT ACCTGCAGGTGCGAGGCCGCGAGAACTT 1249 

I Mill I III III III I II II II III II 

GATGG AGAATATTTCAC CCTTCAGATCCGCGCGCGTGAGCGCTT 1115 



CGAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGC 

iiiiii ; mini iii i mi n i in 

CG AG ATGTTC CGAGAGCTG AATG AGGCC TTGG AACTC AAGG A 



1199 
1071 



1299 
1157 



CGCAGCCGCTGGTAGACTCCTATCGGCAGCACCAGCAGCTCCTACAG AGG 1349 

II Iflll II II III I Mill II III 

TGCCCAGGCTGGGAAAGAGCCAGCGG . . GGAGCAGGGCTCACTCCAGCCA 1205 

CCGAGTCACCTACAGCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAA 1399 

II II I I 11 Mil III 

CCTGAAGTCCAAGAAGGGGCAATCTACCTCCCGCC^TAAAAAATTCATCT 1255 

C AAGGTGCACGGGGGCGTG AAC AA GCTGC CCTCCGTC AACCAGCTGGTGG 1449 

i i mi i ii iii i i i inn i i 

TCAAGACAGAGGGGCCTGACTCAGACTGACATTC TCAGCTTCTTG 1300 

G C C AGCCTCCCC CGC AC AGCTCGGC AGCT AC ACC CAACCTGGGACCTGTG 1499 

I II I II llllll III II I I II 

TTCCCCCACTGAGCCTCCCACCCCCATCT . CTCCCTCCCCTGCCATTTTG 1349 

GGCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGA 1549 

i mm i iii i ii mi i ii iii i 

AGTTCTGCOTCTTTAAACCCT TC CTr G CAATAGGTC 1399 

GATGACCAGCAGCCACGGCACCCAGTCCATCGTCTOGGGGTCCCACTGCA 1599 

A 1400 



FIG.1 cont. : 
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1 MAQSTTTSPDGGTTFEHLWSSLEPDSTYFDLPOSSRGNNEVVGGTDSSMp 50 

..|:::-.:|. :| :-|: II • .=11 : • -I „ 

1 MEEPOSDPSIEPPLS QETFSDLWKLLPENNVLSPLPSQAVD 41 

51 VTHLEGhrTTSVMAQFNLLSSTMDQMSSRAASASPYTPEHAASVPTHSPYA 100 

: | ... : ||: ... 1= I . • • I • • I I - ■ I • ■ I : 

42 DLML . . . SPDDLAQWLTEDPGPDEAPRHSEAAPHMAPTPAAPTPA . APAP 87 

101 OPS ST FDTMS P APVI P S NTDY PG PHHFEVTFQQS STAKS ATWTYS PLLKX 150 

.11..: - - : | | . - . | - | . - I : • I = h 1 I I I - I I I I I I ■ I 

B8 APSWPL SSSVPSQKTYHGSYGFRLGFLHSGTAKSVTCTYSPDLNK 13 2 

151 LYCOIAKTCPIQIKVSAPPPPGTAIRAMPVYKKAEHVTDIVKRCPNHELG 200 

::||:||lthl:-l ••UN* : I I I : ' I I • • = I * I ! = I * I I I ! I I 
133 MFCQlJ^TCPVQLV^STPPPGSRVRAMAIYKQSQHMTEVVRRCPHHE. . 180 

2 01 RDFNEGQSAPASHLIRVEGNl^SQYVDDPVrGRQSyW 250 

I ||: Mllllll =1 II- I I : I I I I I I I I I : I I - s I ^ 

181 RCSDSDGLAPPQHLIRVEGNLRVEYSDDRNTFRHSVWPYEPPEVGSDCT 230 

251 TI LYNFMCNSSCVGGMNRRP I LI I ITLETRDGOVLGRRSFEGRICAC PGR 3 00 

|| I hill IM-MIII-- I^III- III -hill III _ n 

231 TI HYtWmCN S SCMGGMNRRP I L.T I ITLEDSSGNLLGRN S FEVRVCAC PGR 280 

301 drkadedhyreo^ai^ss/u^aaskraf^ 350 

281 DRRTEEENFRKKG . . EPCHELPWSTWt^PNNTSSSPQ PKKKPL 323 

3 51 DEOTYTW5VRGRENFEIU0aKESLEt^ 400 
3 24 TCEYFtUUiUeW-EMFR^^ 373 
401 HLQPPSYGP^SPMNKVHGGVNKl*PSVNOLVGOPPPHSSAATPNLGPVGS 450 

374 GQSTSRKKKFMFKTEGPDSD 393 



FIG. 2 
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1 TCCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTCTGCTCCTGCGAAGGGG 50 

: mini mi i mini iiiiiiiiiMiiiiiiiiiiiiimmi < 

_ 1 TGCCTCCCCGCCCGCGCACCCGCCCCGAGCCCTGTGCTCCTGCGAAGGGG 50 

51 ACGCACCGAAGCCGGGGCCCGCCCCAGGCCGGCCGGCACGGACGCCGATC 100 

I I III I II lllllllllltl IIMIMII IMIIIIIIIIIIillllMI I 

51 ACGCAGCGAAGCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATG 100 
101 CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGGCCGGTGTGA 150 

I I III I II I !M 1 1 1 IHIMMI MM I i I II M IIIMII IIIHIII I 

_ ioi CCCGGAGCTGCGACGGCTGCAGAGCGAGCTGCCCTCGGAGGCCGGTGTGA 150 

151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGGCACCACGTTT 200 

: i ii 1 1 iii m 1 1 1 1 im i ii nmi 1 1 1 mi i iiniiii mum i nn 

151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGGCACCACGTTT 2O0 
' 201 G AGC ACCTC TGG AGCTCTCTGG AACC AG AC AGC ACCT ACTTCG ACCTTC C 250 

: i n him ii ii iiim n ii iiiimi nun iimminii ii i _ 

201 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCGACCTTCC 250 ^ 
251 CCAGTCAAGCCGCCGGAATAATGAGGTGGTGGGTGGCACGGATTCCACCA 300 

I | M || II III I I IIIM II II IIIMII Mil II IMIMI 11 llll Ml _ , 

251 CCAGTCAAGCCGCGGCAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 1 

301 TGGACCTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 3 50 

I 1 | I 1 | I 1 I 1 I I I 1 I I I I I I 1 I I I I 1 I I I II I 1 I t I 1 i I I I I I I I I I I 1 1 I e 

_ 301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 350 

~ 351 AATTTGCTG AG C AGC ACCATGGACCAGATGAGC AGCCGCGCTGCCTCGGC 400 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 k 1 1 1 1 1 1 1 1 f IJJLJL 1 1 nn 

351 AATTTGCTGAGCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGC 400 
401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 450 

I I II II MIMM IIIMII MMIMM MIMMIMMMMMiM I _ a 

401 CAGCCCGTACACCCCGGAGCACC^CGCCAGCGTGCCCACCCATTCACCCT 450 / 
451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTOTCATC 500 

Z I M Ml MIMI IIMMl II IMIIII MMMMMIIIMIIMM I 

451 ACGCACACXrCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 

501 CCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGGTCACTTTCCA 550 

I 1 1 | 1 f 1 I I I 1 I 1 1 1 I 1 t I I I I 1 I 1 1 1 I I I 1 I f 1 I I I I I t 1 I I 1 tllllJL I ecn 

_ 501 CCCTCCAACACCG ACTATC CCGGACCCC ACCACTTCGAGGTCACTTTCC A 550 

~ 551 GC AGT CC AGC ACGGCCAAGTC AGCC ACCTXM ACGTACTCCCC ACTCTTG A 600 

I IMMMMMIIMMIIMIIMIIIIllillMMinillllllll _ n 

551 GC AGT CCAGC ACGG CC AAGTC AGC CAC CTGG ACGT ACT CCC C ACTCTTG A 600 

601 AGAAACTXTTACTGCCAGATC^CAAGACA^ 650 

I | | | 1 | 1 | | 1 1 1 I I 1 I ] I I I I 1 I I I ■ I I 1 I I 1 1 I I 1 I I I t I I I JJL ■ IJULtJL ccn 

Z 601 AGAAACTCTACTGCCAG 650 

651 TCCGCCCCAC^GCCCCCTGGOtfX^ 700 | 
Z | | | | | | | | | | | | | | I | | I | I I I I I I I I I I I I I I I I I I I lllllllll M I 

" 651 TTCTCCCCACCtXTCtXCGGCACC^^ 700 ; 

701 GAAGC^GGAGCAC^nXSACCGACATCGTGAAGCGCTC 750 

I Ml I M MIMM II II IMM MM MIMM M IMMMIMMMI _ n 

Z 701 GAA^GGAGCACGTGACCGACATWTGAAGCGCr^ 750 

751 TCGGGAGGGACTTCAACGAAGGACAGTCTGCCCCAGCCAGCCACCTCATC 800 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 JIJI I M onn 

- 751 TCC^AC^ACTTCAAC^ 80° 

CCTGTGGAA<WAATAATCTCTCGCACTATCTTC 850 



eoi 



TTTm ii m TiT i? Ti ii iTii T T TtmTTTTTrmTTtTTT " o pig Q 

rCTGraAAC^AAT^ 850 I I W . %J 



801 CGTCTGGAAG«AATAATCTCTCGCACTATGTTO 
851 CAGGCAGAGCGTCGTGGTGCCCTATCAGCCACCACAGGTGGGGACAGAAT 900 

851 CAGTCAGAGCGTCGTCGTGCCCT *™ ^ KJl 1 L 
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901 
901 



951 



TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTCGGGGGC 950 
M II II Hi II II II III II II llllll! II II III! IIHtllliJill 
TCACCACCATCCTCTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGC 950 



ATGAACCGACGCCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGG 1000 

QC1 M MM I 1 1 II II II IIIMMIIIIIIIII1I II IIMIM llllllll 

951 ATGAACCGACGGCCCATCCTCATC ATCATC ACCCTGGAGACGCGGG ATGG 



1000 



1001 



GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 1 050 

i r 1 1 1 1 1 1 i 1 1 1 1 m 1 1 1 1 1 1 1 1 1 M 1 1 i i 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1001 GCAGGTGCTGGGCCGCCGGTCCTTCGAGGGCCGCATCTGCGCCTGTCCTG 1050 
1051 GCCGCGACCGAAAAGCCCATCAGGACCACTACCGGCACCAGCAGGCCTTG 1100 

1 1 1 f 1 1 1 1 i 1 1 [ 1 1 1 1 1 1 j ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 

1051 GCCGCGACCGAAAAGCCG ATGAGGACCACTACCGGGAGCAGCACGCCTTG 1100 
1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

MM II f I M Ml IIMMIII IMMMMII II MM1MMIMMI 

1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 
1151 GAGTCCCCCTGCCCTCCCCCCCCTGGCCCCGGGTCTGAAGAAGCGCCGGC 1200 

f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 [ 1 1 1! 1 1 1 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 

1201 ACCGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCCCCAGAACTTC 1250 
I I 1 I 1 I I t f I I 1 t I I f I I I f I I I 1 I I I I I 1 1 1 I 1 I I I f I I f I I I t I I I I t 

12 01 ACGG AGACGAGGAC ACGTACTACCTGCAGGTGCG AGGCCGCGAG AACTTC 1250 

1251 GAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGCC 1300 

Ml I MMMMMMIMMM1M MM IMIIIMMIMIMII II 

1251 GAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTGGTGCC 1300 
1301 GC AG CCGCTGGT AGACTCCTATCGGC AGCAGCAGC AGCTCCT ACAG AGCC 13 50 

1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f ii 

1301 GCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGGC 1350 
1351 CGAGTCACCTACACCCCCCATCCTACGGGCCGGTCCTCTCGCCCATGAAC 1400 

III III I II MINIMI llllll M II II IMII II II II Ml II INI 

13 51 CGAGTCACCTACAGCCCCCATCCTACGGCCCGGTCCTCTCGCCCATGAAC 1400 



1401 AAGCTGCACGGGGGCGTGAACAAGCTCCCCTCCCTCAACCAGCTGGTGGG 1450 

I M MM II 1 1 II II 1 1 II IMM II M II III II M II IIMM Ml M 

1401 AAGGTGCACGGGGGCGTGAACAAOCTGCCCTCCGTCAACCAGCTGGTGGG 1450 
1451 CCAGCCTCCCCCGCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTGG 1500 

I I Mil II II III IMMMIIMM M II IMII MM II fliflll II 

1451 CCAGCCTCCCCCCCACAGCTCGGCAGCTACACCCAACCTGGGACCTGTGG 1500 

1501 GCTCTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCGAG 1550 

I IMII II II I I Ml II II II Mill II II lllll II II II lllll II II 
1501 GCTCTGGGATGCTCAACAACCACGGCCACGCAGTCCCAGCCAACAGCGAG 1550 

1551 ATGACCAGCAGCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCAC 1600 

II M I Ml II 1 1 1 II IIMM lllll IIMMIII MM IIMIM Mil 

1551 ATG ACC AGC AGCC ACGGCACCCAGTCCATGGTCTCGGGGTCC CACTGCAC 1600 
1601 TCCGCCACCCCCCTACCAC^CGACCCCAGCCTCGTCA G rrTTTTAA 1650 

MM MM li II I II IMMMIMI II II I! MMI 

1601 TCCGCCACCCCCCTACCACGCCGACCCCAGCCTCGTC 1637 



1701 AGCATTTACCACCTGCAGAACCTGACCATCGAGGACCTG<WGGCCCTGAA 1750 

1 1 1 1 1 i I II 1 1 1 1 1 1 1 1 M 

1636 AGGACCTGGGGGCCCTGAA 1656 



17 51 G ATCCCCG AGC AGT ATCCC ATG ACCATCTGGCGGGGCCTGC AGG ACCTGA 

I II I II II II II MIMM MM MMMMMMMMM MMIMM 



1800 



FIG.3 
cont. 
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1657 GATCCCCG AGCACTATCGCATGACCATCTGGCGGGGCCTGCAGGACCTGA 1706 
1801 AGCAGCGCCACGACTACGGCGCCGCCGCGCAGCACCTGCTCCGCTCCAGC 1850 

HI f II II IliM III III Ml llllllllllllll Mill lllllll II 

1707 AGCAGGGCCACGACTACGGCGCCGCCGCGCAGCAGCTGCTCCGCTCCAGC 1756 
1851 AACGCGCCCGCCATTTCCATCGGCGCCTCCGGGGAGCTGCAGCGCCAGCG 1900 

II HIM 1 1 1 1 III II 1 1 1 1 II 1 1 1 IIIIIIIM I II M II llllllli [ 

17 57 AACGCGGCCGCCATTTCCATCGGCGGCTCCGGGGAGCTGCAGCGCCAGCG 1806 
1901 GGTCATGGAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCA 1950 

H (III 1 1 1 1 Hill I IIMIII II Mill II II I III MMIH IMII 

1807 GGTCATGGAGGCCGTGC ACTTCCGCGTGCGCCAC ACCATCACC ATCCCC A 1856 
1951 ACCGCGGCGGCCCCGGCGCCGGCCCCGACGAGTGGGCGGACTTCGGCTTC 2 000 

Ml Ml M IMIMIIIHIIIMI IIIMIMIM IIMIIIII HIM 

18 57 ACCGCGGCGGCCCCGGCGCCGGCCCCG ACG AGTGGCCGG ACTTCGGCTTC 1906 
2001 G ACCTGCC CGACTGCAAGGCCCGC AAGC AG CCC ATCAAGGAGG AGTTC AC 2050 

IMIIIII MIMIIMIIMIinillllHIIMIHIIIMMiMI 

1907 GACCTG CC CGACTGCAAGGCCCG C AAGC AGCCC ATCAAGGAGG AGTTC AC 1956 
2051 GGAGGCCGAGATCCACTGAGGGGCCGGCCCCAGCCAGAGCCTGTGCCACC 2100 

I I I Ml M M II HIM HMM IIIIIIMIMI IMMMII I Mill 

19 S 7 GGAGGCCGAGATCCACTGAGGGGCCGGGCCCAGCCAGAGCCTGTGCCACC 2006 



2101 GCCCAGAGACCCAGGCCGCCTCGCTCTC 2128 

II Hill I II HIM IMIIH I IMII 

2007 GCCCAGAGACCCAGGCCGCCTCGCTCTC 2034 



FIG.3cont. 
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1 TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCTGCGAAGGCGACGCAGCGAA 6 0 

6 1 GCCGGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATGCCCGGAGCTGCGACGGCTGC 120 

121 AGAGCGAGCTGCCCTCGGAGGCCGGTGTGAGGAAGATGGCCCAGTCC ACCACCACCTCCC 180 

-10 MAQSTTTSP 9 

181 CCGATGOGGGCACCACGTTTGAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACT 2 40 

10 DGGTTFEHLWSSLEPDSTYF 29 

2 41 TCG ACCTTCCCCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGC ACGGATTCCAGC A 300 
30 DLPQSSRGNNEVVCCTDSSM 49 

301 TGGACCTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC AATTTGCTGA 360 

50 D VFHLEGMTTSVMAQFNLLS 69 

3 61 GCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGCCAGCCCGTAC ACCCCGGAGC 420 
"70 STMDQMSSRAASASPYTPEH 89 

421 ACGCCGCCAGCGTGCCC ACCCATTCACCCTACGCACAGCCC ACCTCCACCTTCGACACCA 480 

90 AASVPTHSPYAQPSSTFDTM 109 

4 81 TGTCGCCCGCGCCTGTCATCCCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGG 540 
110 SPAPVI PSNTDYPGPHHFEV 129 
541 TCACTTTCCAGCAGTCCAGC ACGGCCAAGTCAGCC ACCTGG ACGT ACTCCCC ACTCTTGA 600 
130 TFQQSSTAKSATWTYS PLLK 149 
601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 6 60 
150 KLYCQIAKTCPIQIKVSAPP 169 
661 CGCCCCCGGGCACCGCCATCCGGCCCATGCCTGTCTACAAGAAGGCGGAGCACCTGACCG 720 
170 PPGTA IRAMPVYKKAEHVTD 189 
7 21 ACATCGTGAAGCGCTGCCCCAACCACGAGCTCGGGAGGGACTTCAACGAAGGACAGTCTG 780 
190 IVKRCPNHELGRDFNEGQSA 209 

7 81 CCCCAGCCAGCCACCTCATCCGTGTGGAAGGC AATAATCTCTCGCAGTATGTGGACGACC 840 
210 PA5HLI RVEGNNLSQYVDDP 229 

8 41 CTGTCACCGGCAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 
230 VTGRQSVVVP. YEPPQVGTEF 249 
901 TC ACC AC C ATCCTGT AC AACTTCATGTGT AAC AGC AGCTCTGTGGGGGGC ATG AACCG AC 960 
250 TT ILYNFMCNSSCVGGMNRR 269 
961 GGCCCATCCTCATCATC ATCACCCTGGAGACGCGGGATGGGCAGGTGCTGGGCCGCCGGT 1020 
270 PILI I ITLETRDGQVLGRRS 289 

1021 CCTTCGAGGGCCGCATCTGCGCCTGTC CTGGCCGCGAC CG AAAAGCCG ATGAGG ACCACT 1080 

290 FEGRICACPGRDRKADEDHY 309 

1081 ACCGGG AGCAGCAGGCCTTG AATG AG AGCTCCGCC AAG AACGGGGCTGCC AG C AAGCGCG 1140 

310 REQQALNESSAKNGAA5KRA 329 

1141 CCTTCAAGCAGAGTCCCCCTGCCGTCCCCGCCCTGGCCCCGGCTGTGAAGAAGCGGCGGC 1200 

330 FKQSPPAVPALGPGVKKRRH 349 

1201 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTCGAGATCCTGA 1260 

350 GDEDTYYLQVRCREKFEILM 369 

1261 TGAAGCTGAAGGAGAGCCTGCAGCTOATGGAGTTt^TGCCGCAGCCGCTGGTAGACTCCT 1320 

370 KLKE5 LELMELVPQPLVDSY 389 

1321 ATCGGCAGCAGCAGCAGCTCCTACAGAGGCCGAGTCACCTACAGCCCCCATCCTACGGGC 1380 

390 RQQQQLLQRPSHLQPPSYGP 409 

410 V L SPMNKVHGGVNKLP S VNQ 429 

1441 AGCTGGTJG^5GCCACCCTCCCCCGCACAGCTCGGCAGCTAC^CCCAACCTGGGACCTCTtK3 1500 

430 LVGQ P P PHSSAATPNLG PVG 449 

1501 GC TCTGGG ATGCTC AAC AACC ACGGC C ACGC AGTGCC AGCCAAC AGCG AG ATG AC C AGCA 1560 

450 SGMLNNHGHAVPANSEMTSS 469 

1561 CKrCACGGCACCCAGTCCATG^'JVltlGGGGTCCCACTGCACTCCGCCACCCCCCTACCACG 1620 

470 HGTQSMVSGSHCTPPPPYHA 489 

1621 CCGACCCCAGCCTCGTC AGTTTTTTAACAGGATTGGCGTGTCCAAACTGCATCGAGTATT 1680 

490 DP SLVSF LTGLGCPNC I EYF 509 



FIG./. 
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1681 TCACGTCCCACGGGTTAC AGACC ATTT ACCACCTGCAGAACCTGACC ATCGAGGACCTGG 17 4 0 

510 TSQGLQSIYHLQNLTIEDLG 529 

1741 GGGCCCTGAAGATCCCCGAGCAGTATCGCATGACCATCTGGCGGGGCCTGCAGGACCTGA 1800 

530 A L K I PEQYRMT I WRGLQ DLK 549 

1801 AGCAGGGCCACGACT ACGGCGCCGCCGCGCAGCAGCTGCTCCGCTCCACC AACGCGGCCG 1860 

550 QGHDYGAAAQQLLRSSNAAA 569 

1861 CCATTTCC ATCGGCGGCTCCGGCGAGCTGCAGCGCCAGCGGGTCATGGAGGCCGTGCACT 1920 

570 ISICCSCELQRQRVKEAVHF 589 

19 21 TCCGCGTGCGCCACACCATC ACC ATCCCCAACCGCGGCGGCCCCGGCGCCGGCCCCGACG 19 80 

590 RVRHTITI PNRGGPGAGPDE 609 

1981 AGTGGCCGGACTTCGGCTTCGACCTGCCCGACTGCAAGGCCCGCAAGCAGCCCATCAAGG 2 04 0 

610 WADFGFDtPD CKARKQPIKE 629 

2041 AGGAGTTCACGGAGGCCG AGATCCACTGAGGGGCCGGGCCC AGCCAGAGCCTGTGCCACC 2100 



630 
2101 
2161 
2221 
22B1 
2341 
2401 
2461 
2521 
2581 
2641 
2701 
2761 
2B21 




GTCCTTAG AGGACCGG WUkTTGTC AAT ATTTGATAAAATG ATACCCTTTTCTAC 2874 
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1 
61 
121 
-10 
181 
10 
241 
30 
301 
50 
361 
70 
421 
90 
4B1 
110 
541 
130 
601 
ISO 
661 
1*70 
721 
190 
781 
210 
841 
230 
901 
250 
961 
270 

1021 
290 

1061 
310 

1141 
330 

1201 
350 

1261 
370 

1321 
390 

1381 
410 

1441 
430 

1S01 
450 

1561 
470 

1621 
490 

1681 

1741 

1801 

1861 

1921 

1981 



TGCCTCCCCGCCCGCGCACCCGCCCCGAGGCCTGTGCTCCT<X*^^ 6 0 

GCCCGGGCCCGCGCCAGGCCGGCCGGGACGGACGCCGATGCCCGGAGCTGCGACGGCTGC 120 

AG AG CG AGCTGC C CTCGG AGGC CGGTG TGAGG AAG ATGGCCCAGTCCACCACCACCTCC C 180 

MAQSTTTSP 9 

CCGATGGGGGCACCACGTTTGAGCACCTCTGGAGCT^TCTGGAACCAGACAGCACCTACT 240 

DGGTTFEHLWSSLEPDSTYF 29 

TCGACCTTCCCCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGC A 3 00 

DLPQSSRGNNEVVGGTDSSM 49 

TGGACGTCTTCCACCTAGAGGGCATX1ACCACATCTGTCATGGCCCAGTTCAATTTGCTGA 3 60 

DVFHLEGMTTSVHAQFNLLS 69 

GCACCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGCCAGCCCGTACACCCCGGAGC 420 

STMDQM'S SRAASASPYTPEH 89 

ACGCCGCC AGCGTGCCC ACCCATTCACCCTACGCACAGCCCAGCTCCACCTTCGACACCA 4 80 

AASVPTHSPYAQPSSTFDTM 109 

TGTCGCCCGCGCXTGTCATCCCCTCCAACACCGACTATCCCGG ACCCCACCACTTCGAGC 540 

S PAPVI PSNTDYPGPHHFEV 129 

TC ACTTTCC AG CAGTCC AGC ACGGCC AAGTC AGCC ACCTGGACCT ACTCCCCACTCTTG A 600 

TFQQSSTAKSATWTYSPLLK 149 

AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 6 6 0 

KLYCQIAKTCPIQIKVSAPP 169 

CGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAAGAAGGCGGAGCACGTGACCG 720 

PPGTAI RAMPVYKKAEHVTD 189 

ACATCGTG AAGCGCTGCCCC AACCACGAGCTCGGGAGGG ACTTCAACGAAGGACAGTCTG 780 

IVK RCPNH.ELGRDFNEGQSA 209 

C C C C AG CC AGCC ACCTC ATCCGTGTGGAAGGCAATAATCTCTCGCAGTATGTGG ACG ACC 84 0 

PA5HLI RVEGNNLSQYVDDP 229 

CTGTCACCGGCAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 

VTGRQSVVVPYEPPQVGTEF 249 

TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGCATGAACCGAC 960 

TTI LYNFMCNSSCVGGMNRR 269 

GGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGGGCAGGTCCTGGGCCGCCGGT 1020 

PI LII ITLETRDGQVLGRRS 289 

CCTTCGAGGGCCGC ATCTGCGCCTGTCCTGGCCGCGACCGAAAAGCCGATGAGG ACC ACT 1 0 B 0 

FEGRICAC PGRDRKADEDHY 309 

ACCGGG AGCAG C AGGCCTTG AATG AGAGCTCCGC C AAGAACGGGGCTGC CAGCAAGCGCG 1140 

REQQALNESSAKNGAASKRA 329 

CCTTCAAGCACAGTCCCCCTGCCCTCCCCGCCCTGGGCCCGGGTCTGAAGAAGCGGCGGC 1200 

FKQS PPAVPALGPGVKKRRH 349 

ACGGAGACG AGGACACCTACTACCTGCAGGTGCG AGGCCGCGAGAACTTCGAGATCCTGA 1260 

GDEDTYYLQ VRGRE NFEILM 369 

TGAAGCTGAAGGAGAGCCTGGAGCrTCATGGAGTTGGTGCCGCA^ 1320 

KLKESLELMELVPQPLVDSY 389 

ATCGGCAGCAGCAGCAGCTCCTACAGAGGCCGAGTCACCTACAGCCCCCATCCTACGGGC 1380 

RQQOQLLQRPSHLQPPSYGP 409 

CGGTCCTCTCGCCCATGAACAACCTGCACGGGGGCGTGAACAAGCTGCCCTCCGTCAACC 14 40 

VLSPMNKVHGGVNKLPSVNQ 429 

AGCTGGTC^SGCCi^CCTCCCCCC^ACAGCTCGCCAGCTACACCCAACCTGGGACCTGTGG 1500 

LVGQPPPHSSAATPNLGPVG 449 

GCTCTOGGATGCTCAACAACCACGG^CAC<^AGTGCCAGCCAACAGCGAGATGACCAGCA 1560 

SGMLMNHGHAVPANSEMTSS 469 

GCCACGGCACCCAGTCCATGGTCTCGGGGTCCCACTGCACTC 1620 

HGTQSMV SGSHCTPPPPYHA 489 

CCGACCCCACOCTCGTCAGGACCTGQGGGCCCTGAAGATCCCCGAGCAGT^ 1680 

DPSLVRTWGP* 509 

C ATCTGG CGGGGCCTGC AGGACCTG AAGCAOGGC ^ST^S^^^^^^^^^ q 1600 

CCAGCGGGTCATGGAGGCCGTGCACTTCCGCGTGCGCCACACCATCACCATCCCCAACCG 1860 

CGGCGGCCCCGGCGCCGGCCCCGACGAGTGGGCGGACTrCGGCrTCGACCTX^CCGACTC 1920 

C AAGG C C C GC AAGC AGCCC ATCAAGG AGG AGTTCACX^ AGGCCGAGATCC ACTTG AGGGGC 1980 
CGGGCCCAGCCAGAGCCTGTGCCACCGCCCAGAGACCCAGGCCGCCTCGCTCTC 2034 



FIG. 5 
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1 GCGAGCTGCCCTCGGAGGCCGGCGTGGGGAAGATGGCCCAGTCCACCGCCACCTCCCCTG 

" 9 MAQSTATSPD 

61 ATGGGGGCACCACGTTTGAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCG 

11 GGTTFEHLWSSLEPDSTYFD 

121 ACCTTCCCCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGCGGAACGGATTCCAGCATGG 

31 LPQSS.RGNNEVVGGTDSSMD 

181 ACGTCTTCCACCTGGAGGGCATGACTACATCTGTCATGGCCCAGTTCAATCTGCTGAGCA 

51 VFHLEGMTTSVMAQFNLLSS 

241 GCACCATGGACCAGATGAGCAGCCGCGCGGCCTCGGCCAGCCCCTACACCCCAGAGCACG 

71 TMDQMSSRAASASPYTPEHA 

3 01 CCGCCAGCGTGCCCACCCACTCGCCCTACGCACAACCCAGCTCCACCTTCGACACCATGT 

91 ASVPTHSPYAQPSSTFD-TMS 

3 61 CGCCGGCGCCTGTCATCCCCTCCAACACCGACTACCCCGGACCCCACCACTTTGAGGTCA 
HI PAPVIPSNTDYPGPHHFEVT 
421 CTTTCCAGCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCGCTCTTGAAGA 
131 FQQSSTAKS ATWTYS PLLKK 

4 61 AACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCACCCCGCCAC 
151 LVCQIAKTCPIQIKVSTPPP 
541 CCCCAGGCACTGCCATCCGGGCCATGCCTGTTTACAAGAAAGCGGAGCACGTGACCGACG 
171 P GTAIRAMPVYKKAEHVTDV 
601 TCGTGAAACGCTGCCCCAACCACGAGCTCGGGAGGGACTTCAACGAAGGACAGTCTGCTC 
191 VKRCPNHELGRDFNEGQSAP 
661 CAGCCAGCCACCTCATCCGCGTGGAAGGCAATAATCTCTCGCAGTATGTGGATGACCCTG 
211 ASHLIRVEGNNLS QYVDDPV 
721 TCACCGGCAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACGGAATTCA 
231 T'GRQSVVVPYEPPQVGTEFT 
7 81 CCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTAGGGGGCATGAACCGGCGGC 
251 TILYNFMCNSSCVGGMNRRP 
841 CCATCCTCATCATCATCACCCTGGAGATGCGGGATGGGCAGGTGCTGGGCCGCCGGTCCT 
271 IL I I I. TLEMRDGQVLGRRSF 
9 01 TTG AGGGC CGC ATCTGCGCCTG TCCTGG C CGCG ACCG AAAAGCTG ATG AGG AC C ACT AC C 
291 EGRICACPGRDRKAD EDHYR 
961 GGGAGCAGCAGGCCCTGAACGAGAGCTCCGCCAAGAACGGGGCCGCC AGCAAGCGTGCCT 
311 EQQALNESSAKNGAASKRAF 

1021 TCAAGCAG AGCCCCCCTGCCGTCCCCGCCCTTGGTGCCGGTGTGAAG AAGCGGCGGC ATG 

331 KQSPPAVPALGAGVKKRRHG 

1081 GAGACGAGGACACGTACTACCTTCAGGTGCGAGGCCGGGAGAACTTTGAGATCCTGATGA 

351 DEDTYYLQVRGRENF E I LMK 

1141 AGCTGAAAG AGAGCCTGGAGCTGATGGAGTTGGTGCCGCAGCCACTGGTGG ACTCCTATC 

371 LKESLELMELVPQPLVDSYR 

1201 GGCAGCAGC AGC AGCTCCTACAGAGGCCGAGTCACCTACAGCCCCCGTCCTACGGGCCGG 

391 QQQQLLQRPSHLQPPSYGPV 

1261 TCCTCTCGCCCATGAACAAGGTGCACGGGGGCATGAACAAGCTGCCCTCCGTCAACCAGC 

411 LS PMNKVHGGMNKLPSVNQL 

1321 TGGTGGGCCAGCCTCCCCCGCACAGTTCGGCAGCTACACCCAACCTGGGGCCCGTGGGCC 

431 VGQPPPHSSAATPNLGPVGP 

13 81 CCGGGATGCTCAACAACCATGGCCACGCAGTGCCAGCCAACGGCGAGATGAGCAGCAGCC 

451 GMLNNHGHAVPANGEMSSSH 
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840 
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1441 

471 
1501 

491 
1561 

511 
1621 

531 
1681 

551 
1741 

571 
1801 

591 
1861 

611 
1921 

631 
1981 
2041 
2101 



AC AGCGCCC AGTCCATGGTCTCGGGGTCCCACTGCACTCCGCCACCCCCCTACCACGCCG 1500 

SAQSMVSGSHCTPPPPYHAD 490 

ACCCCAGCCTCGTCAGTTTTTTAACAGGATTGGGGTGTCCAAACTGCATCG AGTATTTCA 1560 

PSLVSFLTGLGCPNC I EYFT 510 

CCTCCCAAGGGTTAC AG AGCATTTACCACCTGC AGAACCTGACC ATTG AGGACCTGGGGG 1620 

SQGLQSIYHLQNLTIEDLGA 530 

CCCTG AAGATCCCCGAGCAGTACCGC ATGACCATCTGGCGGGGCCTGCAGGACCTGAAGC 16 80 

LKIPEQYRMTIWRGLQDLKQ 550 

AGGGCCACGACTACAGCACCGCGCAGCAGCTGCTCCGCTCTAGCAACGCGGCCACC ATCT 17 40 

GHDYSTAQQLLRSSNAAT I S 570 

CCATCGGCGGCTCAGGGGAACTGCAGCGCCAGCGGGTC ATGGAGGCCGTGC ACTTCCGCG 1800 

IGGSGELQRQRVMEAVHFRV 590 

TGCGCCACACCATC ACCATCCCCAACCGCGGCGGCCCAGGCGGCGGCCCTGACGAGTGGG 18 60 

RHTITI PNRG.GPGGGPDEWA 610 

CGGACTTCGGCTTCGACCTGCCCGACTGCAAGGCCCGC AAGC AGCCC ATCAAGGAGGAGT 1920 

DFGFDuPDCKARKQPI KEEF 630 

TCACGGAGGCCGAGATCCACTGAGGGCCTCGCCTGGCTGCAGCCTGCGCCACCGCCCAGA 19 80 

T E A E I K * 650 

GACCCAAGCTGCCTCCCCTCTCCTTCCTGTGTGTCCAAAACTGCCTCAGGAGGCAGGACC 2040 

TTCGGGCTGTGCCCGGGGAAAGGCAAGGTCCGGCCCATCCCCAGGCACCTCACAGGCCCC 2100 
AGGAAAGGCCC AGCCACCGAAGCCGCCTGTGGACAGCCTGAGTCACCTGCAGAACC 2156 
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i$J 9£ACCCAAGGA^^ 60 

121 AGCATCTGTATGGGCCCTGTGTATGAATCCTTGGGGCAGGCCCAGTTC Jon 

0 MCMCPVYESLCQAQFKLL s" 19 

1 AGTGCCATGGACCAGATGGGCAGCCGTGCCCCCCCGGCGAGCCCCTACACCCCGGAGC^ 2 40 
20SAMDQMGSRAAPASPYTP 7h 19 

241 <^CGCCAXX:GCGCCCACCCACTCGCCCT^ 3 % 0 

40AASAPTHSPYAQPSSrrDTM 59 

301 TCTCCC^GCCTCTCATCCCTTCCAATAC^^ 360 

60SPAPVIPSNTOYPGPHHFE V 79 

3 61 ACCTTCCAGCAGTCGAGCACTGCCAAGTCGGCCACCTGGACATACTCCCCACTCTTGAAG 420 

BOTFQQSSTAKSATWTYSPLLK 99 

f n J AAGTOGTACTGTCAGATTGCTAAGACATGCCCCATCCAGATCAAAGTG^ 4 g 0 

119 
540 

, » A attgttaagccctgccccaaccacgagcttggaag<k;acttc 600 

140IVKRCPNHELGRDFNEG <Tsa 159 

6 0 1 CCC^CTAGCCACCTCATCCGTGTAGAAGGCAACAJVCCTCGCCCAGTACGTGGATGACCCT 6 6 0 

160PASHLIRVEGNNLAQYVDDP 179 

661 gtcaccggaag<x:agagtgtggttgtgccgtatgjuvcccccacaggtgggaacag 720 

180VTGRQSVVVPYEPPQVG T E F 199 

III AC CACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGCATGAATCGCAGG 7 80 

200 TTILYNFMCNSSCVGGMNRR 219 

C C C AT CC TTGTCATC ATC AC C CTGG AG ACCCGGG ATGG AC AXXJTCCTGGGCCCCC GG TCT 640 



181 



100 
481 
120 
541 



781 



KLYCQIAKTCPIQIKVSTPP 

cccccgcgcac^ccatccggcccatgcctc 

PPCTAIRAMPVYKKAEHVTD 



220 PILVIITLETRDGQVLGRRS 239 

84i ttcgagcctcccatctct<k:c^^ 900 

240 FEGRICACPGRDRKADEDHY 259 

901 CGGGACCAACACKXTTCTCAATGAAAOT^^ 960 

260 REQ-QALNE5TTKNGAA5XRA 279 

961 TTCAAGCAGAGCCCCCCTTCCATCCCTW^ 1020 

280 FK Q S P PA I P A L G TNVKKRRH 299 

1021 CWGGACGAGGACATCTTCTACATGCACGT^ 10 80 

300 GDEDMFYMHVRGRENFEILM 319 

1081 AAAGTCAAGGAGAGCCTAGAACTCATGGAGCTTOTGCCCCAGCL 1 1 l * ll« ACTCCTAT 1140 

320 KVKES LELMELV PQ PLVDSY 339 

1141 C G AC AGC AGC AGC AGC AGC AGCTCCT AC AG AGGCCGAGTC ACCTGCAGC CTCCATCCTAT 1200 

340 RQQQQQQLliQRPSHLQPPSY 359 

1201 cxxjcccxhtctctccccaatgaacaa^ 1260 

360 GPVLS PHNKVHGGVNRLPSV 379 

1261 AACC AGCTGG TGGGCC AGCCTCCC CCGCAC AGCTCAGCAGCTGGGCCCAACCTGGGGCCC 1320 

380 NQLVGQPPPHSSAAGPN L CP 399 

1321 ATGGGCTCCGGGATGCTCAACAGCCACGGCCACAGCATGCCGGCCAAT^ 1380 

400 MGSGNI.N5HGHSMPANGEMN 419 

1381 GGAGGCCACAGCTCCCAGACCATGGTTTCCGGATCCCACTGCACCCCGCCACCCCCCTAT 144 0 

420 GGHSSQTMVSGSHCTPPPPY 439 

1441 CATGcAGACCCCAGCCTCCTCAXnTTTTTGACAGGGTC 1500 

440 HADPSLVSFLTGLGCPNCIE 459 

1501 TGCTTCACTTCCCAAGGGTTGCAGAGCATCT^ i 560 

460 CFTSQGLQSIYHLQNLTIED 479 

1561 CTTGGGGCTCTGAAGGTCCC TG ACCAGTACCG T ATCACCATCTGGAGGGGCCTAC AGG AC 1620 

480 LGALKVPDQYRMTIWRGLQD 499 

1621 CTCAAGCAGAGCCATGACTt^GGCCAGCAACTGCTACGOrCCAiXAGCAACGCGGCCACC 1680 

500 L K Q S H DCGQQLLRSSSNAAT 519 

1681 ATCTCCATCX^GCCTCTGGCGACCTGC^^ 1740 

520 ISIGGSGELQRQRVMEAVHF 539 

17 41 CGTGTGCGCCACACCATCACAATCCCCAACCGTGGAGGCCCAGGT GO GG^ 1800 

540 R V R H T 1TIPNRGGAGAVTCP 559 

1801 GACGAGTtXX^GGACTTTGGCTTTCACCTGCtrro 1860 

560 DEWADFGFDLPDCKSRKQPI 579 

1861 AAAGAGGAGTTCACAGAGACAGAGAGCCACTGAGGAACGTACC'nVl"lV11 J C A\> TCCTTC 1920 

580 KEEFTETESH* 599 

1921 CTCTGTGAGAAACTUJlXrnx^AAg^^ 1980 

1981 GGACCTTCTGCCGGATGCCATTCCTGAAGGGAACTCGCTCATG 2 0 4 0 
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1 TGGTCCCGCTTCC^CCAAGACTCCGGCTACCACCTTGCGGGCCCCGCGGAGGACGAGACC 60 

6 1 CCGCTGGGGCTAGCTGGGCGACGCGCGCCAAGCGGCGGCGGGAAGGAGGCCGGACGACCG 12 0 

121 GGGCCCGAGACCCCGACTCGGGCAGAGCCAGCTGGGGAGGCGGGGCX^GCGTGGGAGCCA 1 fi 0 

181 GG<MCCCG<^TGGCCGGCCCTCCTCCGCCACGGCTGAGTGCCCGCGCTGCCTTCCCGCGG 240 

2 41 GTCCGCCAAGAAAGGCGCTAAGCCTGCGGCAGTCCCCTCGCCGCCGCCTCCCTGCTCCGC 300 

3 01 ACCCTTATAACCCGCCGTCCCGCATCCAGGCGAGGAGGCAACGCTGCAGCCCAGCCCTCG 360 

3 61 C CG ACGCCG ACGCCCGGCC CGG AGC AG AATGAGCGGC AGCGTTGCCG AGATGGCCCAC AC 42 0 
-0 MSGSVCEMAQT 11 

4 21 CTCTTCTTCCTCCTCCTCCACCITCGAGCACCTGTGGAGTTCTCTAGAGCCAGACAGCAC 480 
12 SSSSSSTFEHLWSS LEPDST 31 

4 81 CTACTTTGACCTCCCCCAGCCCAGCCAAGGGACTAGCGAGGCATCAGGCAGCGAGGAGTC 54 0 

32 Y F DL PQPSQGTSEASGS EES 51 

541 C AACATGGATGTCTTCCACCTGCAAGGC ATGGCCCAGTTCAATTTGCTC AGCAGTGCCAT 600 

52 NMDVFHLQGMAQFNLLSSAM 71 

601 GGACCAGATGGGCAGCCGTGCGGCCCCGGCGAGCCCCTAC ACCCCGGAGC ACGCCGCCAG 660 

72 DQMGSFAAP ASPYTPEHAAS 91 

661 CGCGCCCACCCACTCGCCCTACGCGCAGCCCAGCTCCACCTTCGACACCATGTCTCCGGC 720 

92 APTHSPYAQPSSTFDTMSPA 111 

721 GCCTGTCATCCCTTCCAATACCGACTACCCCGGCCCCC 7 58 
112 PVIPSNTDYPGP 123 
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Name : 
Name : 
Name : 
Name : 
Name : 



sr-p70a-cos3 

sr-p70b-cos3 

sr-p70-hc29 

sr-p70c-act20 

sr-p70a-att20 



Len: 650 Check: 9661 Weight: 1.00 

Len: 650 Check: 3605 Weight: 1.00 

Len: 650 Check: 85 Weight: 1.00 

Len: 650 Check: 4072 Weight: 1.00 

Len: 650 Check: 4204 Weight: 1.00 



1 50 

_ sr-p70a-cos3 MAQ STTTSPDCGT TFEHLWSSLE PDSTYFDLPQ SSRGNNEWG 

sr-p70b-cos3 MAC STTTSPDCGT TFEHLWSSLE PDSTYFDLPQ SSRGNNEWG 

sr-p70-ht29 MAQ STATSPDGGT TFEHLWSSLE PDSTYFDLPQ SSRGNNEWG 

_sr-p70c-att20 

_sr-p70a-aCt20 MSGSVGEMAQ . . .TSSSSSS TFEHLWSSLE PDSTYFDLPQ PSQGTSEASG 

Z 51 100 

Sr-p70a-cos3 GTDSSMD . VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

sr-p7 Ob-COS 3 GTDSSMD. VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_ sr-p7 0-ht2 9 GTDSSMD . VF KLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_sr-p70c-att20 . . . MCMGPVY . . ESLG ... Q AQFNLLS SAM DQMGSRAAPA SPYTPEHAAS 

_sr-p7 0a-att20 SEESNMD . VF HLQGM AQFNLLSSAM DQMGSRAAPA SPYTPEHAAS 

I 101 150 

Sr-p70a-cos3 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

Sr-p70b-cos3 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

_ sr-p7 0-ht29 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

_sr-p70c-att20 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAKSATW 

_sr-p70a-att20 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GP 

~_ 151 200 

sr-p7 0a-cos3 TYSPLLKKLY CQIAKTCPIQ IKVSAPPPPG T A I RAMPVYK KAEHVTDIVK 

_ sr-p7 Ob-cos 3 TYSPLLKKLY CQIAKTCPIQ IKVSAPPPPG TAI RAMPVYK KAEHVTDIVK 

sr-p70-ht29 TYSPLLKKLY CQIAKTCPIQ IKVSTPPPPG TAI RAMPVYK KAEHVTDWK 

_sr-p70c-att20 TYSPLLKKLY CQIAKTCPIQ IKVSTPPPPG TAI RAMPVYK KAEHVTDIVK 

_sr-p70a-att20 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
_ sr-p70-ht29 
_sr-p7 0c-att20 
_sr-p70a-att20 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
_ sr-p70-ht29 
_sr-p70c-att20 
_sr-p70a-att20 



_ sr-p70a-cos3 
_ sr-p7 Ob-cos 3 
_ sr-p70-ht29 
_sr-p70c-att20 
_sr-p70a-att20 



201 250 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSVWPYEP 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL AQYVDDPVTG RQSVWPYEP 



251 



300 



PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL IIITLETRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL IIITLETRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL IIITLEMRDG QVLGRRSFEG 

PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL VI ITLETRDG QVLGRRSFEG 



301 350 
RICACPGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALCF 
RICACPGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALGP 
RICACPGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPAXCA 
RICACPGRDR KADEDHYREQ QALNESTTKN GAASKRAFKQ SPPAIPALGT 
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351 



400 



sr-p70a-cos3 
sr-p70b-cos3 
I sr-p70-ht29 
_sr-p70c-att20 
sr-p70a-att20 



sr-p70a-cos3 
sr-p70b-cos3 
sr-p70-ht29 
sr-p70c-att20 
_sr-p70a-att20 



GVKKRRHGDE DTYYLQVRCR ENFEILMKLK ESLELMELVP QPLVDSYR. - 
GVKKRRKCDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR- - 
GVKKRRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR . . 
NVKKRRHGDE DMFYMHVRGR ENFEILMKVK ESLELMELVP QPLVDSYRQQ 

401 450 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG MNKLPSVNQL VGQPPPHSSA 
QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 



451 500 
" sr-p70a-cos3 ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 
" sr-p70b-cos3 ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 
~ S r-p70-ht29 ATPNLGPVGP GMLNNHGHAV PANGEMSSSH SAQSMVSGSH CTPPPPYHAD 
Isr-p70c-att20 AG PNLGPMG S GMLNSHGHSM PANGEMNGGH SSQTMVSGSH CTPPPPYHAD 
_sr-p70a-att20 

501 550 
' sr-p70a-cos3 PSLVSFLTGL GCPNCIEYFT SQGLQSIYHL QNLTIEDLGA LKIPEQYRMT 

sr-p70b-cos3 PSLVR..T.W G.P 

" sr-p70-ht29 PSLVSFLTGL GCPNCIEYFT SQGLQSIYHL QNLTIEDLGA LKIPEQYRMT 
Isr-p70c-att20 PSLVSFLTGL GCPNCIECFT SQGLQSIYHL QNLTIEDLGA LKVPDQYRMT 
Isr-p70a-att20 

551 600 
" sr- P 70a-cos3 IWRGLQDLKQ GHDYGAAAQQ LLR. SSNAAA ISIGGSGELQ RQRVMEAVHF 

sr*p70b-cos3 ' * ' * "~ 

" sr-p70-ht29 IWRGLQDLKQ GHDYS.TAQQ LLR.SSNAAT ISIGGSGELQ RQRVMEAVHF 
Isr-p70c-act20 IWRGLQDLKQ SHDCG. . .QQ LLRSSSNAAT ISIGGSGELQ RQRVMEAVHF 
Isr-p70a-att20 

601 650 
Z sr-p70a-cos3 RVRHTITIPN RCGPGA. .CP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 

sr-p70b-cos3 

~ sr-p70-ht29 RVRHTITIPN RGGPGG..GP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 
Isr-p70c-att20 RVRHTITIPN RGGAGAVTGP DEWADFGFDL PDCKSRKQPI KEEFTETESH 
_sr-p70a-att20 
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< i > 10 ^ .> » < !■> 11 

351 DEDTYYL^RGRENFEILMKLKESLELMELVPQPLVDSYRQQQQLLQRPS 400 

11,1111 II I MM I 

324 DGEYFTLQltRGRERFEMFRELNEALELKDAQAGKEPGGSRAHSSHLKSKK 37 3 

< 1 ■> 10 . 



^ >17 

401 HLQPPSYGPVLSPMNKVHGGMNKLPSVNQLVGQPPPHSSAATPNLGPVGP'4 5 0 

374 GQSTSRHKKLMFKTEGPDSD 393 

< | > 13 

451 GMLNNHGHAVPANGEMSSSHSAQSMVSGSHCTPPPPYHADPSLVSFLTGL 500 

< I > I 4 

501 GCPNCZEYFTSQGLQS IYHLQNLTIEpLGALKIPEQYRMTIWRGLQDLKQ 550 



I 1 MAQS. .TATSPDGGTTFEHLWSSLEPDSTYFDLPQSSRGNNEWGGTDSSMD 50 

I M I II II I II , I! 

x ^ I MEEPQSDPSVEPPLSQETFSDU«£LLPE N NVLjSPLP SQAMD 4 1 

51 VFHLEGMTTSVMfvQTOLLSSTMDQMSSRAASASPYTPEHAASVPTHSPYA 100 

I I I II I II I I 

42 DLML. . .SPDDIEQWFTEDPGPDEAPRMPEAAPPVAPAPAAPTPA. APAP 87 

ioi qpsstfdtmspapvipsntdypgphhfevtfqqsstaksatot|ys'pllkk 150 ' 

M N II I I I I I I I I III I I I I , 

88 APSWPL SS SVPSQKTYQGSYGFRLGFLHSGTAKSVTCTreSPALNK 132 

. < 1 > S 

151 LYCOIAKTCPIQIKVSTPPPPGTAIRAMPVYKKAEHVTDWKRCPNHELG 2O0 
M Mill I I Mill | | | || | Ml III II 

133 mfcqlaktc pvqlwvdst pppgtrvramai ykqsqhmtewrrc phhe . . 180 
201 rdfnegqsapashlirvegnnlsqyvddpvtgrqsvwpyepp3vcteft 250 

I H I I I I I I I I III I I I I I I I I I I I || I | 

181 RCSDSDGLAPPQHLIRVEGNLRVEYLDDRNTFRHSVWPYEPPEk/GSDCT 230 

< T >. g <-| > 8 . <* > / 

251 TILYNFMCNSSCVGGMNRRPILIIITLEMRDGQVLGRRSFEGRICACPGR 300 

II I ! Illlll MINIMI Mill I III III I 1 1 1 1 1 1 

231 T IH YNYMCNS SCMGGMNRRP I LT 1 1 T L EDS ^GNL LGRNS FEVRVCAC PGR 280 

301 DRKADEDHYREQQALNESSAKNGAASraAFKQS P PAVPALGAGVKKRRHG 3 50 

M I I III I I 
281 DRRTEEENLRKKGEPHHELP. . PGSTKRALPNNTSSSPQ PKKKPL 323 



551 GHDYSTAQQLLRSSNAATISIGGSGELQRQRVMEAVHFRVRHTITIPNRG 600 

I 

601 GPGGGPDEWADFGFDLPDCKARKQPIKEEFTEAEIH 636 
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sr-p70d-imr32 
sr-p70a-ht29 





CG 
CG 


ACCTTCCCCA 
ACCTTCCCCA 


GTCAAGCCGG 
GTCAAGCCGG 


GGGAATAATG 
GGGAATAATG 


32 
150 


AGGTGGTGGG 
AGGTGGTGGG 


CGGAACGGAT 
CGGAACGGAT 


TCCAGCATGG 
TCCAGCATGG 


ACGTCTTCCA 
ACGTCTTCCA 


CCTGGAGGGC 
CCTGGAGGGC 


82 
200 


ATGACTACAT 
ATGACTACAT 


CTGTCATGCA 
CTGTCAT 


TCCTCGGCTC 


CTGCCTCACT 


AGCTGCGGAG 


132 


CCTCTCCCGC 


TCGGTCCACG 


CTGCCGGGCG 


GCCACGACCG 


TGACCCTTCC 


217 
182 


CCTCGGGCCG 


CCCAGATCCA 


TGCCTCGTCC 


CACGGGACAC 


CAGTTCCCTG 


232 


GCGTGTGCAG 


ACCCCCCGGC 


GCCTACCATG 


CTGTACGTCG 


GTGACCCCGC 


282 



ACGGCACCTC GCCACGGCCC AGTTCAATCT GCTGAGCAGC ACCATGGACC 3 32 
GGCCC AGTTCAATCT GCTGAGCAGC ACCATGGACC 2 52 

AGATGAGCAG CCGCGCGGCC TCGGCCAGCC CCTACACCCC AGAGCACGCC 3 82 
AGATGAGCAG CCGCGCGGCC TCGGCCAGCC CCTACACCCC AGAGCACGCC 3 02 

GCCAGCGTGC CCACCCACTC GCCCTACGCA CAACCCAGCT CCACCTTCGA 432 
GCCAGCGTGC CCACCCAcTC GCCCTACGCA CAACCCAGCT CCACCTTCGA 3 52 

CACCATGTCG CCGGCGCCTG TCATCCCCTC CAACACCGAC TACCCCGGAC 482 
CACCATGTCG CCGGCGCCTG TCATCCCCTC CAACACCGAC TACCCCGGAC 402 

CCCACCACTT TGAGGTCACT TTCCAGCAGT CCAGCACGGC CAAGTCAGCC 532 
CCCACCACTT TGAGGTCACT TTCCAGCAGT CCAGCACGGC CAAGTCAGCC 452 

ACCTGGACGT ACTCCCCGCT CTTGAAG 
ACCTGGACGT ACTCCCCGCT CTTGAAG 
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□ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: 



IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 



BEST AVADLABLE IMAGES 




ILURRED OR ILLEGIBLE TEXT OR DRAWING 



□ SKEWED/SLANTED IMAGES 



□ COLOR OR BLACK AND WHITE PHOTOGRAPHS 



□ GRAY SCALE DOCUMENTS 



